zyhxq / fossil-gui

0 stars 0 forks source link

HBase学习心得 #3

Open zyhxq opened 8 years ago

zyhxq commented 8 years ago

HBase简介 HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 Hbase基于hadoop的HDFS系统,其文件存储都是存储在HDFS上的。由上图看到HBase主要处理两种文件:一种是预写日志(Write-Ahead Log,WAL)即图中的HLog。另一种文件是实际的数据文件HFile(HFile本事就是HDFS的文件,文件格式遵循HBase可导入的格式)。预写日志WAL是可开关的,器主要保障数据的稳定性。当机器结点挂掉,可以通过回放日志达到数据恢复的目的

zyhxq commented 8 years ago

http://www.searchtb.com/2011/01/understanding-hbase.html

zyhxq commented 8 years ago

基础概念 Client HMaster 主要负责Table和Region的管理工作:

Zookeeper HRegionServer HRegion HLog,WAL HFILE StoreFile MemStore 行键 列族 时间戳 ROOT表 META表 用户表 Hadoop

OLTP----联机事务处理 OLAP----联机分析处理 ETL(extrat---transtorm----Load)