`
lc_koven
  • 浏览: 349958 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

hbase中的deleteColumn

阅读更多
    Delete类的接口有两个方法:deleteColumns和deleteColumn,它们的区别从method注释里可以看到:
    deleteColumns:Delete all versions of the specified column with a timestamp less than or equal to the specified timestamp.
    deleteColumn:Delete the latest version of the specified column.


    实现上,前者只是传给server一个时间标签,表示这行数据的最后删除版本,因此仅相当于一个普通的put
    但是后者必须定位到这行version,因此需要先get到这行数据,再做处理

    实际使用中有个陷阱,细心的人会发现如果对某行数据的一个version进行了删除,在compact之前即使再将同一个version的数据写进去,也是读不到的。原因是hbase定位数据是依靠rowkey/timestamp/family/qulifier。假如这四者都一样,那么多次put/delete是无法知道先后顺序的。因此取哪个值取决于KeyValue.Type的值,Delete是在Put之前。所以扫描到Delete就不会再去读Put了。
    要想恢复对这个timestamp标签的读写,必须做一次compact,最好是major_compact,确保这一行数据己经从物理上删除了,此时就可以再读取值了。
0
0
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics