`

google bigtable 读书笔记

阅读更多
1.一个行可以分成多个tablet(应该是一个tablet包含了相关的多个行记录),Tablet是数据分布和负载均衡调整的最小单位。这样做的结果是,当操作只读取行中很少几
列的数据时效率很高,通常只需要很少几次机器间的通信即可完成。
2.列关键字组成的集合叫做“列族“,列族是访问控制的基本单位。一张表中的列族不能太多(最多几百个),并且列族在运行期间很少改变。与之相对应的,一
张表可以有无限多个列。
3.BigTable内部存储数据的文件是Google SSTable格式的。SSTable是一个持久化的、排序的、不可更改的
Map结构,而Map是一个key-value映射的数据结构,key和value的值都是任意的Byte串。可以对
SSTable进行如下的操作:查询与一个key值相关的value,或者遍历某个key值范围内的所有的keyvalue对。也就是sstable可以进行range 操作?
4.相较于mysql,bigtable可以让用户定制一些数据存储和分布方式,从而提高性能。
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics