HBase的条件查询 -

dajuezhao

浏览: 59719 次
性别:
来自: 北京

最近访客更多访客>>

wjboy49

jaydonluo

追求卓绝

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

HBase的条件查询

博客分类：

hbase

HBase Hadoop 工作

一、环境

HBase版本hbase-0.20.5，Hadoop的版本hadoop-0.20.2，JDK1.6

二、需求背景

在HBase中，进行条件查询，很多的文件都说过，但是大多数都是在说明如何设置合理的表结构以及如何设置rowkey进行查询检索，这样的结构设计可以在一定层度上通过rowkey来定位查询（速度很快），但是，如果我是已知某个列的值，需要看有多少行的列包含这个值，那么这样的需求通过rowkey来查询就显得不合适。最早我的想法是查询内容，然后遍历，但是这样的效率明显是很低下的，所以，我寻求了其他的解决办法。

三、操作过程

1、一些已知rowkey这样的查询内容我就不在这里描述，网络上有很多这样的内容，我在下面只是说在已知列值的情况下进行的一些查询工作。

2、阅读API，发现了一个SingleColumnValueFilter类，就看名字大概知道作用，细看，然后查了些资料，编写了代码如下，先看代码：
public class HBaseFilterTest {

public static void main(String[] args) {
try {
HBaseConfiguration conf = new HBaseConfiguration();
conf.set("hbase.master.port", "IP:PORT");
conf.set("hbase.zookeeper.quorum", "IP");
HTable table = new HTable(conf, "scores");
Filter course_art_filter = new SingleColumnValueFilter(Bytes.toBytes("course"), Bytes.toBytes("art"),
CompareOp.EQUAL, Bytes.toBytes("art"));
Scan s = new Scan();
s.setFilter(course_art_filter);
// 指定之后，将只返回一个cell，也就是指定的那一个
// s.addColumn(Bytes.toBytes("course"), Bytes.toBytes("art"));
ResultScanner scanner = table.getScanner(s);
scanner = table.getScanner(s);
for (Result rr = scanner.next(); rr != null; rr = scanner.next()) {
System.out.println("rowkey = " + new String(rr.getRow()));
System.out.println("first cell value = " + rr.getCellValue());
System.out.println("cell[] length = " + rr.getCellValues().length);
System.out.println("getCellValues()[2] = " + rr.getCellValues()[2]);
System.out.println("get local cell value = "
+ rr.getCellValue(Bytes.toBytes("course"), Bytes.toBytes("art")));
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
3、代码写的比较粗糙，但是一些具体的内容反映出来了.

四、总结
抛砖引玉了，filte还有很多，如果细致，可以看看其他的filter类，这样是可以辅助我们在使用hbase进行查询的效率和功能的。
当然，对于前面说到的rowkey的设计也是十分重要的。复合的查询不仅能够缩短时间，也能加快查询的效率和速度。

分享到：

Hive使用杂记 | 配置HBase使用Map/Reduce

2010-10-27 09:46
浏览 3338
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

node-v4.9.0-linux-armv7l.tar.xz: Node.js，简称Node，是一个开源且跨平台的JavaScript运行时环境，它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立，旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎，可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型，这使得它非常适合处理大量并发连接，从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外，Node.js使用了模块化的架构，通过npm（Node package manager，Node包管理器）,社区成员可以共享和复用代码，极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展，它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等，因此，开发者可以用JavaScript编写全栈应用程序，这一点大大提高了开发效率和便捷性。在实践中，许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台，如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能，简化了开发流程，并且能更快地响应市场需求。

node-v4.8.4-linux-armv6l.tar.xz: Node.js，简称Node，是一个开源且跨平台的JavaScript运行时环境，它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立，旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎，可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型，这使得它非常适合处理大量并发连接，从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外，Node.js使用了模块化的架构，通过npm（Node package manager，Node包管理器）,社区成员可以共享和复用代码，极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展，它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等，因此，开发者可以用JavaScript编写全栈应用程序，这一点大大提高了开发效率和便捷性。在实践中，许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台，如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能，简化了开发流程，并且能更快地响应市场需求。

NBGLC3...NBGLC3...NSK系列产品说明书: NSK NBGLC3... Caja de montaje Manual de instrucciones

中南大学毕业设计论文--花琪.docx: 中南大学毕业设计论文--花琪.docx

基于Tensorflow、OpenAI搭建的强化学习框架，训练机器自动操盘.zip: 基于Tensorflow、OpenAI搭建的强化学习框架，训练机器自动操盘强化学习（Reinforcement Learning, RL），又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一。它主要用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习的特点在于没有监督数据，只有奖励信号。强化学习的常见模型是标准的马尔可夫决策过程（Markov Decision Process, MDP）。按给定条件，强化学习可分为基于模式的强化学习（model-based RL）和无模式强化学习（model-free RL），以及主动强化学习（active RL）和被动强化学习（passive RL）。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略搜索算法和值函数（value function）算法两类。强化学习理论受到行为主义心理学启发，侧重在线学习并试图在探索-利用（exploration-exploitation）间保持平衡。不同于监督学习和非监督学习，强化学习不要求预先给定任何数据，而是通过接收环境对动作的奖励（反馈）获得学习信息并更新模型参数。强化学习问题在信息论、博弈论、自动控制等领域有得到讨论，被用于解释有限理性条件下的平衡态、设计推荐系统和机器人交互系统。一些复杂的强化学习算法在一定程度上具备解决复杂问题的通用智能，可以在围棋和电子游戏中达到人类水平。强化学习在工程领域的应用也相当广泛。例如，Facebook提出了开源强化学习平台Horizon，该平台利用强化学习来优化大规模生产系统。在医疗保健领域，RL系统能够为患者提供治疗策略，该系统能够利用以往的经验找到最优的策略，而无需生物系统的数学模型等先验信息，这使得基于RL的系统具有更广泛的适用性。总的来说，强化学习是一种通过智能体与环境交互，以最大化累积奖励为目标的学习过程。它在许多领域都展现出了强大的应用潜力。

基于值函数逼近的强化学习方法玩经典的马里奥游戏: 尝试用基于值函数逼近的强化学习方法玩经典的马里奥游戏，取得了一定成果强化学习（Reinforcement Learning, RL），又称再励学习、评价学习或增强学习，是机器学习的范式和方法论之一。它主要用于描述和解决智能体（agent）在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。强化学习的特点在于没有监督数据，只有奖励信号。强化学习的常见模型是标准的马尔可夫决策过程（Markov Decision Process, MDP）。按给定条件，强化学习可分为基于模式的强化学习（model-based RL）和无模式强化学习（model-free RL），以及主动强化学习（active RL）和被动强化学习（passive RL）。强化学习的变体包括逆向强化学习、阶层强化学习和部分可观测系统的强化学习。求解强化学习问题所使用的算法可分为策略搜索算法和值函数（value function）算法两类。强化学习理论受到行为主义心理学启发，侧重在线学习并试图在探索-利用（exploration-exploitation）间保持平衡。不同于监督学习和非监督学习，强化学习不要求预先给定任何数据，而是通过接收环境对动作的奖励（反馈）获得学习信息并更新模型参数。强化学习问题在信息论、博弈论、自动控制等领域有得到讨论，被用于解释有限理性条件下的平衡态、设计推荐系统和机器人交互系统。一些复杂的强化学习算法在一定程度上具备解决复杂问题的通用智能，可以在围棋和电子游戏中达到人类水平。强化学习在工程领域的应用也相当广泛。例如，Facebook提出了开源强化学习平台Horizon，该平台利用强化学习来优化大规模生产系统。在医疗保健领域，RL系统能够为患者提供治疗策略，该系统能够利用以往的经验找到最优的策略，而无需生物系统的数学模型等先验信息，这使得基于RL的系统具有更广泛的适用性。总的来说，强化学习是一种通过智能体与环境交互，以最大化累积奖励为目标的学习过程。它在许多领域都展现出了强大的应用潜力。

基于GPT-3.5的多封邮件摘要生成器.zip: GPT, 通常指的是“Generative Pre-trained Transformer”（生成式预训练转换器），是一个在自然语言处理（NLP）领域非常流行的深度学习模型架构。GPT模型由OpenAI公司开发，并在多个NLP任务上取得了显著的性能提升。 GPT模型的核心是一个多层Transformer解码器结构，它通过在海量的文本数据上进行预训练来学习语言的规律。这种预训练方式使得GPT模型能够捕捉到丰富的上下文信息，并生成流畅、自然的文本。 GPT模型的训练过程可以分为两个阶段：预训练阶段：在这个阶段，模型会接触到大量的文本数据，并通过无监督学习的方式学习语言的结构和规律。具体来说，模型会尝试预测文本序列中的下一个词或短语，从而学习到语言的语法、语义和上下文信息。微调阶段（也称为下游任务训练）：在预训练完成后，模型会被应用到具体的NLP任务中，如文本分类、机器翻译、问答系统等。在这个阶段，模型会使用有标签的数据进行微调，以适应特定任务的需求。通过微调，模型能够学习到与任务相关的特定知识，并进一步提高在该任务上的性能。 GPT模型的优势在于其强大的生成能力和对上下文信息的捕捉能力。这使得GPT模型在自然语言生成、文本摘要、对话系统等领域具有广泛的应用前景。同时，GPT模型也面临一些挑战，如计算资源消耗大、训练时间长等问题。为了解决这些问题，研究人员不断提出新的优化方法和扩展模型架构，如GPT-2、GPT-3等，以进一步提高模型的性能和效率。

基于深度学习tensorflow的滚动轴承故障诊断方法源码（高分Python大作业）.zip: 基于深度学习tensorflow的滚动轴承故障诊断方法源码（高分Python大作业）.zip已获导师指导并通过的97分的高分大作业设计项目，可作为课程设计和期末大作业，下载即用无需修改，项目完整确保可以运行。基于深度学习tensorflow的滚动轴承故障诊断方法源码（高分Python大作业）.zip已获导师指导并通过的97分的高分大作业设计项目，可作为课程设计和期末大作业，下载即用无需修改，项目完整确保可以运行基于深度学习tensorflow的滚动轴承故障诊断方法源码（高分Python大作业）.zip已获导师指导并通过的97分的高分大作业设计项目，可作为课程设计和期末大作业，下载即用无需修改，项目完整确保可以运行基于深度学习tensorflow的滚动轴承故障诊断方法源码（高分Python大作业）.zip已获导师指导并通过的97分的高分大作业设计项目，可作为课程设计和期末大作业，下载即用无需修改，项目完整确保可以运行基于深度学习tensorflow的滚动轴承故障诊断方法源码（高分Python大作业）.zip已获导师指导并通过的97分的高分大作业设计项目，可作为课程设计和期

智慧交通设计方案[57页PPT].pptx: 智慧交通设计方案[57页PPT].pptx

基于51单片机的多路温度采集系统+全部资料+详细文档（高分项目）: 【资源说明】基于51单片机的多路温度采集系统可设置各从机的温度报警上、下限值，主机、从机均具有报警功能；主机可实时、定时收集各从机的数据（注意项目基于Proteus8.7，所以基于8.7才能完美运行，仿真要用的串口助手和虚拟串口自行选择即可，串口助手记录的时间为代码编译开始记录，所以想要更新时间自己编译一下代码）+全部资料+详细文档（高分项目）【备注】 1、该项目是个人高分项目源码，已获导师指导认可通过，答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用，也可作为毕业设计、课程设计、作业、项目初期立项演示等，当然也适合小白学习进阶。 4、如果基础还行，可以在此代码基础上进行修改，以实现其他功能，也可直接用于毕设、课设、作业等。欢迎下载，沟通交流，互相学习，共同进步！

typescript-5.1.5.tgz: Node.js，简称Node，是一个开源且跨平台的JavaScript运行时环境，它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立，旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎，可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型，这使得它非常适合处理大量并发连接，从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外，Node.js使用了模块化的架构，通过npm（Node package manager，Node包管理器）,社区成员可以共享和复用代码，极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展，它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等，因此，开发者可以用JavaScript编写全栈应用程序，这一点大大提高了开发效率和便捷性。在实践中，许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台，如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能，简化了开发流程，并且能更快地响应市场需求。

分布式电网动态电压恢复器模拟装置（软硬件设计文件+论文）: 【作品名称】：分布式电网动态电压恢复器模拟装置（软硬件设计文件+论文）【适用人群】：适用于希望学习不同技术领域的小白或进阶学习者。可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。【项目介绍】：采用DC-AC及AC-DC-AC双重结构，前级采用功率因数校正（PFC）电路完成AC-DC变换，改善输入端电网电能质量。后级采用单相全桥逆变加变压器输出的拓扑结构，输出功率50W

基于MAX78000的猫咪识别喂食器+全部资料+详细文档（高分项目: 【资源说明】基于MAX78000的猫咪识别喂食器，基于SSD目标检测网络，在单片机的CNN加速器上进行神经网络计算+全部资料+详细文档（高分项目基于MAX78000的猫咪识别喂食器，基于SSD目标检测网络，在单片机的CNN加速器上进行神经网络计算+全部资料+详细文档（高分项目【备注】 1、该项目是个人高分项目源码，已获导师指导认可通过，答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用，也可作为毕业设计、课程设计、作业、项目初期立项演示等，当然也适合小白学习进阶。 4、如果基础还行，可以在此代码基础上进行修改，以实现其他功能，也可直接用于毕设、课设、作业等。欢迎下载，沟通交流，互相学习，共同进步！

[00015014]大学英语D-1.doc: [00015014]大学英语D-1.doc

基于单片机的红外二氧化碳探测，区域网通信+全部资料+详细文档（高分项目）.zip: 【资源说明】基于单片机的红外二氧化碳探测，区域网通信+全部资料+详细文档（高分项目）.zip基于单片机的红外二氧化碳探测，区域网通信+全部资料+详细文档（高分项目）.zip基于单片机的红外二氧化碳探测，区域网通信+全部资料+详细文档（高分项目）.zip 【备注】 1、该项目是个人高分项目源码，已获导师指导认可通过，答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用，也可作为毕业设计、课程设计、作业、项目初期立项演示等，当然也适合小白学习进阶。 4、如果基础还行，可以在此代码基础上进行修改，以实现其他功能，也可直接用于毕设、课设、作业等。欢迎下载，沟通交流，互相学习，共同进步！

电气原理图入门.docx: 电气原理图是电气工程领域中的一种重要工具，它是电路设计、分析和故障排除的基础。无论是从事电气工程的专业人士，还是对电气领域感兴趣的初学者，掌握电气原理图的基础知识都是至关重要的。本指南旨在帮助初学者快速入门电气原理图，从基础概念到实践操作，逐步深入了解电路图的绘制、理解和应用。

基于LangChain+GPT实现的ACT答疑机器人.zip: GPT, 通常指的是“Generative Pre-trained Transformer”（生成式预训练转换器），是一个在自然语言处理（NLP）领域非常流行的深度学习模型架构。GPT模型由OpenAI公司开发，并在多个NLP任务上取得了显著的性能提升。 GPT模型的核心是一个多层Transformer解码器结构，它通过在海量的文本数据上进行预训练来学习语言的规律。这种预训练方式使得GPT模型能够捕捉到丰富的上下文信息，并生成流畅、自然的文本。 GPT模型的训练过程可以分为两个阶段：预训练阶段：在这个阶段，模型会接触到大量的文本数据，并通过无监督学习的方式学习语言的结构和规律。具体来说，模型会尝试预测文本序列中的下一个词或短语，从而学习到语言的语法、语义和上下文信息。微调阶段（也称为下游任务训练）：在预训练完成后，模型会被应用到具体的NLP任务中，如文本分类、机器翻译、问答系统等。在这个阶段，模型会使用有标签的数据进行微调，以适应特定任务的需求。通过微调，模型能够学习到与任务相关的特定知识，并进一步提高在该任务上的性能。 GPT模型的优势在于其强大的生成能力和对上下文信息的捕捉能力。这使得GPT模型在自然语言生成、文本摘要、对话系统等领域具有广泛的应用前景。同时，GPT模型也面临一些挑战，如计算资源消耗大、训练时间长等问题。为了解决这些问题，研究人员不断提出新的优化方法和扩展模型架构，如GPT-2、GPT-3等，以进一步提高模型的性能和效率。

《复盘》——把经验转化为能力-89页.pdf: 《复盘》——把经验转化为能力-89页.pdf

CP2102 USB to UART Bridge Controller 驱动 Win11 USB转串口驱动: CP2102 USB to UART Bridge Controller 驱动 Win11 USB转串口驱动

基于51单片机的矩阵键盘密码锁+全部资料+详细文档（高分项目）.zip: 【资源说明】基于51单片机的矩阵键盘密码锁+全部资料+详细文档（高分项目）.zip基于51单片机的矩阵键盘密码锁+全部资料+详细文档（高分项目）.zip基于51单片机的矩阵键盘密码锁+全部资料+详细文档（高分项目）.zip 【备注】 1、该项目是个人高分项目源码，已获导师指导认可通过，答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用，也可作为毕业设计、课程设计、作业、项目初期立项演示等，当然也适合小白学习进阶。 4、如果基础还行，可以在此代码基础上进行修改，以实现其他功能，也可直接用于毕设、课设、作业等。欢迎下载，沟通交流，互相学习，共同进步！

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

HBase的条件查询

评论

发表评论

相关推荐

配置HBase使用Map/Reduce

HBase中关于中文的处理

HBase分布式安装手册

最近访客更多访客>>