问题导读:
1.如何查询row key前缀相同的数据?
2.hbase查询实现方式有几种?
3.通过Java api,如何实现过滤前缀?
如果你在hbase表中存在一些特征相同的记录,实际上就可以通过设置Filter的方式进行检索过滤。
比如这个特征是前缀相同。
可以发现这三条记录都是以Jerry开头的row key.
那么我们如何检索呢。很简单。
如果是在hbase shell中
scan ‘scores’, {FILTER => org.apache.hadoop.hbase.filter.PrefixFilter.new(org.apache.hadoop.hbase.util.Bytes.toBytes(‘Jerry’))}
如果是java 客户端
- public void scaneByPrefixFilter(String tablename, String rowPrifix) {
- try {
- HTable table = new HTable(conf, tablename);
- Scan s = new Scan();
- s.setFilter(new PrefixFilter(rowPrifix.getBytes()));
- ResultScanner rs = table.getScanner(s);
- for (Result r : rs) {
- KeyValue[] kv = r.raw();
- for (int i = 0; i < kv.length; i++) {
- System.out.print(new String(kv[i].getRow()) + " ");
- System.out.print(new String(kv[i].getFamily()) + ":");
- System.out.print(new String(kv[i].getQualifier()) + " ");
- System.out.print(kv[i].getTimestamp() + " ");
- System.out.println(new String(kv[i].getValue()));
- }
- }
- } catch (IOException e) {
- e.printStackTrace();
- }
- }
http://blog.sina.com.cn/s/blog_68674da70102v6q2.html
分享到:
相关推荐
hbase分页查询实现.pdf
该文档是介绍hbase的rowkey设计与hbase的协处理器运用,与大家分享!
1、有多个工具可选择使用
因为面向列的特点,Hbase只能单单地以rowkey为主键作查询,而无法对表进行多维查询和join操作,并且查询通常都是全表扫描,耗费资源较大,查询效率较低。类比于传统型数据库里的一些查询方式,本文对Hbase的存储原理进行了...
hbase分页查询实现
hbase client包装类,超大数据海量数据时,hbase前缀匹配查询非常慢,提供了解决办法,能够取得较好的效果,包括setStartRow和setRowPrefixFilter两种方式。
本人原创, 1.Hbase连接需要改Hbase包中的两个配置文件,加上Hbase所在机器ip及端口 2.HBaseDMLT初始化环境 3.MapDataIni为建表 4.MapDataInsert为写数据 5.MapDataDelete为删除数据 6.MapDataRead为读数据
HBase官方指南——数据模型篇
Phoniex 可以让开发者在HBase数据集上使用SQL查询。Phoenix查询引擎会将SQL查询转换为一个或多个HBase scan,并编排执行以生成标准的JDBC结果集,对于简单查询来说,性能甚至胜过Hive。 标签:Phoniex
在本次实验的第一题是用编程Java API实现指定功能,并用Hadoop提供的HBase Shell命令完成相同任务。在本题中学习了列出HBase所有的表的相关信息,在终端打印出指定的表的所有记录数据,向已经创建好的表添加和删除...
hbase java api 访问 查询、分页 详情请看:http://blog.csdn.net/wild46cat/article/details/53321409
hbase查询分页分页
本文接着上期介绍的”简单了解Hbase及快速入手之入门教程_01“,着重介绍了hbase的伪分布式部署以及hbase的过滤器。适合刚入门或者刚接触的小伙伴参考。
hbase的使用 相关,包括spark、hadoop在hbase的使用,很好的资源。
hadoop jar /usr/lib/hbase/hbase-0.90.4-cdh3u3.jar importtsv -Dimporttsv.columns=HBASE_ROW_KEY, catgyname,catgyid1,catgyname1,catgyid2,catgyname2,catgyid3,catgyname3,catgyid4,catgyname4,catgyid5,...
本文当是一个基于HBase的海量数据的实实时查询系统的原理分析。详细的介绍了大数据查询的原理。
HBase原理及实例
HBase MapReduce完整实例.rar
基于HBase的车联网海量数据查询.pdf
hbase分页查询实现[归类].pdf