Welcome to Apache HBase™ Apache HBase™ is the Hadoop database, a distributed, scalable, big data store. When Would I Use Apache HBase? Use Apache HBase when you need random, realtime read/write access to your Big Data. This project's goal is the hosting of very large tables -- billions of rows X millions of columns -- atop clusters of commodity hardware. Apache HBase is an open-source, distributed, versioned, non-relational database modeled after Google's Bigtable: A Distributed Storage System for Structured Data by Chang et al.

HBase Un article de Wikipédia, l'encyclopédie libre. HBase est un système de gestion de base de données non-relationnelles distribué, écrit en Java, disposant d'un stockage structuré pour les grandes tables. HBase est inspirée des publications de Google sur BigTable. Comme BigTable, elle est une base de données orientée colonnes. HBase est un sous-projet d'Hadoop, un framework d'architecture distribuée. La base de données HBase s'installe généralement sur le système de fichiers HDFS d'Hadoop pour faciliter la distribution, même si ce n'est pas obligatoire.

Understanding HBase and BigTable - From The hardest part about learning HBase (the open source implementation of Google's BigTable), is just wrapping your mind around the concept of what it actually is. I find it rather unfortunate that these two great systems contain the words table and base in their names, which tend to cause confusion among RDBMS indoctrinated individuals (like myself). This article aims to describe these distributed data storage systems from a conceptual standpoint. After reading it, you should be better able to make an educated decision regarding when you might want to use HBase vs when you'd be better off with a "traditional" database.

Hive! Bigtable: système de bases de données distribué version Google Aspirer l’intégralité du Net comme le fait Google et l’indexer – afin de satisfaire plus d’un milliard de requêtes par jours – nécessite un système d’accès aux données capable de trouver une information rapidement dans une volumétrie considérable. Contrainte supplémentaire, les temps de réponse doivent être très rapides pour ne pas éveiller l’impatience des internautes. Les SGBDR traditionnelles ne suffisent plus pour satisfaire de tels besoins: les temps de réponses deviennent trop important sur de telles volumétries (on parle ici de Petabytes ).

