`
run_xiao
  • 浏览: 192326 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

HBase源代码阅读-6-数据逻辑模型HTableDescriptor

阅读更多

6.数据逻辑模型HTableDescriptor
            HBase中表结构由HTableDescriptor描述(包括HColumnDescriptor),对表的新增\修改\删除操作在接口HMasterInterface中定义,而该接口由HMaster实现
            (1)HTableDescriptor包含:
                表名,byte[]和String格式;
                表的元信息,以key-value形式存储,包括文件最大的大小(默认256M)、是否只读、flush时内存占用大小(默认64M)、是否root或meta region、DEFERRED_LOG_FLUSH;
                表的各Family描述HColumnDescriptor;
               
            (2)HColumnDescriptor:描述column family的信息,包括:
            压缩格式(不压缩,仅压缩value,压缩block中的一系列记录);
            数据的版本数量;
            block的大小(???);
            是否在内存中;
            是否cache block;
            是否使用bloomfilter;
            cell内容的存活时间(ttl);
            是否复制。
            当一个column family创建后,其参数不能修改,除非删除掉该column family后新建一个,但删除column family也会删除掉该column family下的数据   
           
                另外,HTableDescriptor中包含ROOT_TABLEDESC和META_TABLEDESC两个实例以描述root和meta表:
                ROOT_TABLEDESC包含一个info的column family,META_TABLEDESC包含一个info和historian两个column family
               
            (3)建表过程(HMaster的createTable方法):若指定了splitKeys则为该table按指定键初始创建多个region,否则仅创建一个region
                a.为table创建HRegionInfo
                b.判断是不是所有的meta region都online(由RegionManager的MetaScanner扫描线程分配meta region)
                c.判断serverManager是否有足够regionserver来创建table(????)
                d.根据步骤a中新建的HRegionInfo创建table:
                    从RegionManager的onlineMetaRegion查找该HRegionInfo应放入哪一个meta region中:
                        在onlineMetaRegion中查找仅比regionName小的meta region,而regionName由tableName,起始Key,和regionId(root为0,meta为1,user当前时间)组成
                    同过master的ServerConnection获取HRegionInterface代理连接到该meta region,并查找对应该table为Key的记录是否存在,若存在则报错该表已存在
                    由RegionManager根据HRegionInfo创建新的user region:
                        在rootDir目录下新建以tableName为名的目录,在tableName目录下新建一个region的目录(经编码后的regionName),并新建一个HRegion对象
                        将region对应记录放入对应meta region中;
                        设置该region状态为未分配,等待分配给regionserver.
                       
            (4)对表的其它操作:disable,enable,delete,这些操作封装在继承自TableOperation的类中
                该类先获得要操作表的所有meta region,扫描这些meta region中所有该表的user region信息并做相应处理,最后处理meta region

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics