HBase

分布式存储系统
HBase是一种高可靠性、高性能、面向列、可伸缩的分布式存储系统,是Google Bigtable的开源实现,也是Apache软件基金会的Hadoop项目的子项目。[1]
利用HBase技术可在PC服务器上搭建起大规模结构化存储集群。GoogleBigtable利用GFS作为其文件存储系统, HBase利用Hadoop HDFS作为其文件存储系统; Google运行Hadoop平台的映射-化简(MapReduce)来处理Bigtable中的海量数据, HBase同样利用Hadoop平台的映射-化简来处理HBase中的海量数据;与Google Bigtable利用Chubby作为协同服务类似, HBase利用Zookeeper作为协同服务。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。HBase是基于列的而不是基于行的模式。在Hadoop生态系统中, HBase位于结构化存储层, Hadoop HDFS为HBase提供了高可靠性的底层存储支持, Hadoop平台的映射为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和失效转移机制(即Failover机制)。[1]

结构介绍

HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
FUJITSU Cliq等商用大数据产品不同,HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。