Welcome 微信登录

首页 / 数据库 / MySQL / HBase之数据模型(DataModel)

HBase基于Google的BigTable构建,是一种column-orientednosql数据库

1.模型视图

1.1概念视图从概念模型上看,HBase的存储逻辑同关系数据库类似,是基于Table的存储,存储视图如图所示:
图中列出了表格的一条记录,com.cnn.www是该记录的主键,contents:、anchor:cnnsi.com和anchor:my.look.ca是表格的column与关系数据库不同的是,这里的cell具有版本的概念(每个cell有多条记录,这些记录通过时间戳来区分彼此).1.2物理视图概念视图只是基于关系数据库的一种参照,在真正的物理存储上,HBase基于另外一种模型,模型视图如图所示:如图所示,HBase实际上是基于列存储的数据库,可简单认为每个ColumnFamily对应一张存储表,表格的RowKey、Timestamp和column确定了每条记录的唯一索引。在物理层面上,表格的数据是通过StoreFile来存储的,每个StoreFile相当于一个可序列化的Map,Map的key和value都是可解释型字符数组,如key的字符数组主要由以下信息组成(value于此类似):
rowlengthrowKey的字符长度
row rowKey的值
columnFamilyLengthcolumnFamily的字符长度
columnFamilycolumnFamily的值
columnqualifiercolumn
timestamp时间戳(版本)
keytypekey的类型(Put,Delete,DeleteColumn,DeleteFamily…)
这样便可从相应的Key/Value键值对中提炼出具体的rowKey、timestamp、columnKey和columnValue等信息。而多个map整合到一起,便形成一张松散的、可分布式的、多维的、可序列话的BigTable。

2.模型概念

2.1ColumnFamilyColumn Family是一组Column的组合,在HBase中,Schema的定义主要为columnFamily的定义,同大多数nosql数据库一样,HBase也是支持SchemaFree的,但是前提要先定义出具体的columnFamily,而在随后的column定义则没有任何约束。
其次,HBase的访问权限控制,磁盘及内存统计等功能都是基于columnFamily层面完成的。2.2Cell概念模型中的cell由row、column和timestamp三元素组成2.3TimestampHBase提供基于cell的版本管理功能,版本号默认通过timestamp来标识,并且呈倒叙排列。这样,最后添加的版本会首先遍历到注:这里的cell指的是概念视图中MongoDB配置Master和Slave模式HBase之体系结构(Architecture)相关资讯      Hbase 
  • HBase 参考文档翻译之 Getting   (08月15日)
  • HBase应用开发回顾与总结系列  (01月10日)
  • Apache HBase 2015年发展回顾与未  (01月04日)
  • 为啥HBase需要搭建SQL引擎层  (02月19日)
  • HBase表数据分页处理  (01月10日)
  • Hbase VS Oracle  (11/21/2015 20:22:40)
本文评论 查看全部评论 (0)
表情: 姓名: 字数