Hbase中文字符与byte[]的转换 -

xiachaofeng

浏览: 50011 次

最近访客更多访客>>

yunlian0621

a03101107

TangoHuang

peter1177

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Hbase中文字符与byte[]的转换

博客分类：

Hbase 中文字符 byte[]

Hbase中文字符 byte[]转换

Hbase客户端信息采用byte[]与服务器进行通信，中文字符与byte[]的转换的转换有两种方式：

1.采用String类自带的函数
String s = "你好中国";
byte [] b = s.getBytes();
对应的byte[]转换为String为:
s = new String(s.getBytes());

2.采用org.apache.hadoop.hbase.util.Bytes类的函数
String s = "你好中国";
byte [] b = Bytes.toBytes(s);
对应的byte[]转换为String为:
s = Bytes.toString(Bytes.toBytes(s));

方法1 与方法2 都能完成自己的转换,输出也正常。
但是两种方法不能混合使用，因为两种方法中b值却一样,
方法1：b = [-60, -29, -70, -61, -42, -48, -71, -6]
方法2：b = [-28, -67, -96, -27, -91, -67, -28, -72, -83, -27, -101, -67]
原因在于换行的时候采用的Charset不一致
在方法2中 Bytes.toBytes(s); 最后调用的是String类中的s.getBytes("UTF-8");而不是s.getBytes()。
s.getBytes("UTF-8")与s.getBytes()最后都调用了的
static byte[] encode(String charsetName, char[] ca, int off, int len)
关键在于charsetName不同。
在看s.getBytes()最后的charsetName，
产生的函数为:
    public static Charset defaultCharset() {
        if (defaultCharset == null) {
    synchronized (Charset.class) {
java.security.PrivilegedAction pa =
    new GetPropertyAction("file.encoding");
String csn = (String)AccessController.doPrivileged(pa);
Charset cs = lookup(csn);
if (cs != null)
    defaultCharset = cs;
                else
    defaultCharset = forName("UTF-8");
            }
}
return defaultCharset;
    }
跟系统参数file.encoding的值有关，查看下本机的file.encoding
System.out.println(System.getProperty("file.encoding"));
值为GB18030,因此以上两种方式产生的byte[]自然不同,
因此Hbase中文字符与byte[]的转换要统一编码格式，全部采用方法2最好,如果要使用String类的方法
使用方法如下：
String s = "你好中国";
byte [] b = s.getBytes("UTF-8");
对应的byte[]转换为String为:
s = new String(Bytes.toBytes(s),"UTF-8");

以上区别只针对与中文的转换,数字与英文以及"`~!@#$%^&*()_+=-|[]{}\\/.,<>?"没有区别！！

2
顶

2
踩

分享到：

Eclipse debug调试

2011-11-23 13:41
浏览 9108
评论(1)
分类:编程语言
查看更多

1 楼 Mybeautiful 2011-11-23

写的很好..

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

HBASE-comparator.zip: HBase的默认行为是按照字节顺序（字典序）对字符串类型的数据进行比较，这可能导致与我们直觉上对于数值大小比较的预期不一致，例如"9"确实会大于"100"。为了解决这个问题，HBase允许用户通过自定义Comparator来定制...

scala 隐式转换与隐式参数的使用方法: 例如，在 HBase 中，我们经常需要将字符串转换到字节数组，这可以使用隐式转换来实现： ```scala object HBasePref { implicit def Str2Bytes(value: Any): Array[Byte] = value match { case str: String => ...

大数据面试宝典包含java基础和spring面试题: - `char`类型可以存储一个中文汉字，因为Java采用Unicode编码，单个`char`可以表示大部分字符。 ##### 23. 抽象类与接口 - **抽象类**：可以有具体实现，也可以有抽象方法。 - **接口**：只能定义抽象方法，Java 8...

大数据Flume架构原理.pdf: SinkProcessor是Flume中的数据处理器，用于对数据进行处理和转换。 Flume基本概念： Event是Flume数据传输的基本单元。Flume以Event的形式将数据从源头传送到最终目的。Event由可选的Headers和载有数据的一个byte...

javaee电子商城系统课程设计样本.doc: javaee电子商城系统课程设计样本.doc

scratch少儿编程逻辑思维游戏源码-糖果大爆险.zip: scratch少儿编程逻辑思维游戏源码-糖果大爆险.zip

spring-boot-2.7.2.jar中文-英文对照文档.zip: # 压缩文件中包含：中文-英文对照文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

spring-boot-1.3.6.RELEASE.jar中文-英文对照文档.zip: # 压缩文件中包含：中文-英文对照文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

GIS安装施工综合方案.doc: GIS安装施工综合方案.doc

基于PHP+CSS+JS+MySQL的选题系统源码——B/S架构下多角色登录与权限管理: 内容概要：本文详细介绍了选题系统源码，涵盖PHP、CSS、JavaScript和MySQL四种核心技术。系统采用B/S架构，支持管理员、审核员、教师和学生四种身份登录，每种身份有独立的功能权限。文中提供了详细的环境搭建指南，如使用phpStudy和Navicat进行项目管理和数据库操作。此外，还展示了关键代码片段，如登录验证、权限管理、数据库设计以及界面优化方法。同时，针对性能优化提出了建议，如解决N+1查询问题的方法。适合人群：适用于有一定编程基础，尤其是对PHP和Web开发感兴趣的开发者和技术爱好者。使用场景及目标：① 学习并掌握B/S架构的应用开发流程；② 实践多角色登录和权限管理的具体实现；③ 提升Web应用的界面优化和用户体验；④ 掌握数据库设计和性能优化技巧。其他说明：本文不仅提供了完整的代码示例，还包括了详细的开发文档和支持材料，帮助读者快速上手并深入理解整个项目的构建过程。

scratch少儿编程逻辑思维游戏源码-下水道冒险猫.zip: scratch少儿编程逻辑思维游戏源码-下水道冒险猫.zip

scratch少儿编程逻辑思维游戏源码-下雨时向北的路.zip: scratch少儿编程逻辑思维游戏源码-下雨时向北的路.zip

三相下垂双逆变器同步并联控制技术的研究与应用: 内容概要：本文深入探讨了三相下垂双逆变器同步并联控制技术，重点介绍了下垂控制的基本原理及其在微电网中的应用。文章详细解释了下垂控制如何通过调整频率和电压幅值来实现负载的自动分配，并讨论了在多台逆变器并联时可能出现的环流问题以及解决方案，如虚拟阻抗法。此外，还介绍了同步环节的关键技术，特别是改进型锁相环的应用，并提供了具体的实现代码示例。最后，文章分享了一些实用的调试技巧和经验，强调了参数整定的重要性。适用人群：从事电力电子、微电网控制领域的研究人员和技术人员。使用场景及目标：适用于希望深入了解三相下垂双逆变器同步并联控制技术的工程师和科研人员，旨在帮助他们掌握核心技术，解决实际工程中的问题。其他说明：文中提供的代码示例和调试方法有助于读者更好地理解和应用相关技术，提高系统的稳定性和性能。

spring-data-redis-1.2.1.RELEASE.jar中文-英文对照文档.zip: # 压缩文件中包含：中文-英文对照文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文-英文对照文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

GEPLC机组自动化装置编程使用说明书.doc: GEPLC机组自动化装置编程使用说明书.doc

scratch少儿编程逻辑思维游戏源码-我的领土.zip: scratch少儿编程逻辑思维游戏源码-我的领土.zip

spring-boot-1.3.3.RELEASE.jar中文文档.zip: # 压缩文件中包含：中文文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

scratch少儿编程逻辑思维游戏源码-我的世界 MMO V1.6.zip: scratch少儿编程逻辑思维游戏源码-我的世界 MMO V1.6.zip

scratch少儿编程逻辑思维游戏源码-坦克(1).zip: scratch少儿编程逻辑思维游戏源码-坦克(1).zip

GSM移动通信网容量解决方案.doc: GSM移动通信网容量解决方案.doc

最近访客 更多访客>>