hbase简介( 二 )


8、列存储HBase是面向列存储的,每个列都单独存储,所以在HBase中列是连续存储的,而行不是 。
9、HBase ShellHBase提供了交互式命令行工具可以进行创建表、添加数据、扫描数据、删除数据等操作和其他一些管理命令 。
 5、HBase的基础架构 

hbase简介

文章插图
 
1、HMaster功能:
1) 监控RegionServer
2) 处理RegionServer故障转移
3) 处理元数据的变更
4) 处理region的分配或移除
5) 在空闲时间进行数据的负载均衡
6) 通过Zookeeper发布自己的位置给客户端
2、RegionServer功能:
1) 负责存储HBase的实际数据
2) 处理分配给它的Region
3) 刷新缓存到HDFS
4) 维护HLog
5) 执行压缩
6) 负责处理Region分片
组件:
1) Write-Ahead logs
HBase的修改记录,当对HBase读写数据的时候,数据不是直接写进磁盘,它会在内存中保留一段时间(时间以及数据量阈值可以设定) 。但把数据保存在内存中可能有更高的概率引起数据丢失,为了解决这个问题,数据会先写在一个叫做Write-Ahead logfile的文件中,然后再写入内存中 。所以在系统出现故障的时候,数据可以通过这个日志文件重建 。
2) HFile
这是在磁盘上保存原始数据的实际的物理文件,是实际的存储文件 。
3) Store
HFile存储在Store中,一个Store对应HBase表中的一个列族 。
4) MemStore
顾名思义,就是内存存储,位于内存中,用来保存当前的数据操作,所以当数据保存在WAL中之后,RegsionServer会在内存中存储键值对 。
5) Region
Hbase表的分片,HBase表会根据RowKey值被切分成不同的region存储在RegionServer中,在一个RegionServer中可以有多个不同的region 。




推荐阅读