hbase利用hint来实现filter快速扫描 - 大神带我来搬砖 - ITeye博客

`

kabike

浏览: 599169 次
性别:
来自: 大连

最近访客更多访客>>

agreetech

confused9090

kavy

aininim

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

fei33423：同意你的说法. hbase 的强一致性分为两部分来说. 数据分 ...
浅谈Hbase 的强一致性
zengwenbo5566： ,高人，刚安装了 genymotion 那个附带 virtu ...
VirtualBox报错Unable to load R3 module GetLastError=1790 (VERR_UNRESOLVED_ERROR
kabike： QQ1289714862 写道这代码有问题吧 bar1 bar ...
AtomicBoolean运用
QQ1289714862：这代码有问题吧 bar1 bar2 那来的你是不是new了两 ...
AtomicBoolean运用
DEMONU：需要依赖这么多东西啊
hbase 0.96和hadoop 2.2 java 客户端的jar依赖

hbase利用hint来实现filter快速扫描

博客分类：

大数据
hbase

阅读更多

hbase只有rowkey上有索引,在rowkey上可以实现快速扫描,想在column上进行条件筛选或者是在rowkey的非前缀部分进行筛选只能通过filter,而一直以为filter只能顺序的遍历所有KeyValue.
但实际上filter可以提供hint来使scanner reseek重新定位,提高查询效率.

比如假设rowkey设计形式为barfoo,前三位是定长的bar属性,后三位是定长的foo属性,在bar属性上查询很容易,因为它是rowkey的前缀,使用startrow和endrow可以快速查询,对于非前缀属性foo来说,指定startrow是没有用的,必须要full scan才行.比如想查询***fo3的行,可以想象使用RegexStringComparator和RowFilter来全表扫描.

但是假设这个table中,bar的基数比较小,foo的基数比较大(即bar的不同值的个数很少,而foo的不同值的个数很多).那么这时候可以通过在Filter的filterKeyValue方法中返回SEEK_NEXT_USING_HINT,告诉scanner进行reseek重定位,比如上述问题中,在检查过ba1fo3后,下一个rowkey是ba1fo4,可以通过hint告知scanner,reseek到ba2fo3的位置,即使hfile中没有ba2fo3这个key,也能定位到附近位置.假设bar的取值有十个,那么经过十次左右reseek,就可以完成文件遍历.

该方法可用于rowkey的非前缀搜索,以及在wide row中进行inter row scan

查看图片附件

0
顶

4
踩

分享到：

FM算法统计独立元素个数 | hbase的caching和batch

2015-01-15 20:23
浏览 2034
评论(1)
分类:开源软件
查看更多

评论

1 楼 zhao_rock 2015-01-15

写的不错，继续努力

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

hbase分页查询实现.pdf: hbase分页查询实现.pdf

hbase分页查询实现: hbase分页查询实现

Hbase与zookeeper文档: HBase是Google Bigtable的开源实现，类似Google Bigtable利用GFS作为其文件存储系统，HBase利用Hadoop HDFS作为其文件存储系统； Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来...

Hbase 表设计与操作: HBase是Google Bigtable的开源实现，类似Google Bigtable利用GFS作为其文件存储系统，HBase利用Hadoop HDFS作为其文件存储系统；Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来...

java解决hive快速导数据到Hbase代码: 基于hadoop的，java实现hive快速导数据到Hbase解决方案。

Hbase调用JavaAPI实现批量导入操作.docx: Hbase调用JavaAPI实现批量导入操作.docx

HBase实现批量存取: 实现了HBase的存取，很有借鉴性。是一个在eclipse运行的完整代码

hbase分页查询实现[归类].pdf: hbase分页查询实现[归类].pdf

HBase指南-带书签高清扫描版pdf: HBase指南-带书签高清扫描版pdf 带完整目录书签的高清版本，不是文字版。

HBase实战(中文扫描版: 学习Hadoop以及Hbase Hbase及Hadoop是开源软件的杰作

HBase分布式事务与SQL实现: SDCC2015-TiDB-刘奇-HBase分布式事务与SQL实现

Hadoop之HBase简介: HBase是Google Bigtable的开源实现，类似Google Bigtable利用GFS作为其文件存储系统，HBase利用Hadoop HDFS作为其文件存储系统；Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来...

HbaseTemplate 操作hbase: java 利用 sping-data-hadoop HbaseTemplate 操作hbase find get execute 等方法可以直接运行

HBase_SI_--_实现HBase_ACID的理论: HBase_SI_--_实现HBase_ACID的理论

hbase安装与hbase架构说明: HBase是Google Bigtable的开源实现，类似Google Bigtable利用GFS作为其文件存储系统，HBase利用Hadoop HDFS作为其文件存储系统；Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用HadoopMapReduce来...

基于hadoop+hbase+springboot实现的分布式网盘系统，适合本科毕业设计: 基于hadoop+hbase+springboot实现的分布式网盘系统，适合本科毕业设计资源包含的整个demo在Hadoop，和Hbase环境搭建好了，可以启动起来。技术选型 1.Hadoop 2.Hbase 3.SpringBoot ...... 系统实现的功能 1.用户...

HBase实战(中文扫描版): HBase实战(中文扫描版)

HBase实战%28中文扫描版%29.pdf: HBase

大数据云计算技术系列 Hadoop之Hbase从入门到精通（共243页）.pdf: HBase是Google Bigtable的开源实现，类似Google Bigtable利用GFS作为其文件存储系统，HBase利用Hadoop HDFS作为其文件存储系统；Google运行MapReduce来处理Bigtable中的海量数据，HBase同样利用Hadoop MapReduce来...

hbase存储csv数据的代码实现: 这是hbase对数据存储的代码实现，让你轻松秒懂hbase，

Global site tag (gtag.js) - Google Analytics