转载:http://www.cnblogs.com/xignzou/p/3329438.html
参考网址:
http://www.oschina.net/code/snippet_142385_4297
http://canofy.iteye.com/blog/718659
在java的很多配置文件中,尤其是国际化资源中经常遇到类似\uf432这样的unicode编码,搜集了下该编码相关的资料,大致处理方法有如下:
1、Unicode转 汉字字符串。
这个过程最简单的方式就是直接获取。比如
String cnStr = "\ufeff\u4e2d\u56fd\u4eba";
System.out.println(cnStr); 即可获取对应的汉字字符 “中国人”;
但是呢,每次从输出读的话也未免过于不方便了,我们使用方法来做转换,直接获取。
参考如下
public static String unicodeToString(String str) { Pattern pattern = Pattern.compile("(\\\\u(\\p{XDigit}{4}))"); Matcher matcher = pattern.matcher(str); char ch; while (matcher.find()) { ch = (char) Integer.parseInt(matcher.group(2), 16); str = str.replace(matcher.group(1), ch + ""); } return str; }
2、获取字符串的unicode编码,这个我们可以通过直接获取字符串的unicode二进制,然后将其byte转换成对应的16进制表示即可,函数示例如下
static String getUnicode(String s) { try { StringBuffer out = new StringBuffer(""); byte[] bytes = s.getBytes("unicode"); for (int i = 0; i < bytes.length - 1; i += 2) { out.append("\\u"); String str = Integer.toHexString(bytes[i + 1] & 0xff); for (int j = str.length(); j < 2; j++) { out.append("0"); } String str1 = Integer.toHexString(bytes[i] & 0xff); out.append(str1); out.append(str); } return out.toString(); } catch (UnsupportedEncodingException e) { e.printStackTrace(); return null; } }
相关推荐
Java中文成Unicode码及从Unicode码转成中文
用Java做的Unicode编码转换器,可以把各国文字转换为Unicode编码,同时也可以反向转换,包含源码。
该文档有常用的java汉字unicode编码
Unicode汉字编码表,包含几乎完整的汉字编码,PDF格式。资源分想给0分的,可是没这个选项,只好选择最低的2分。
unicode和中文互相转换工具,支持不同编码格式。
unicode 汉字转换器 unicode 汉字转换器 基于java编写,是个jar包,安装jdk后,直接双击
Unicode汉字编码表,UCS-2标准的,从U4e00-U9fa0
unicode汉字转换unicode汉字转换unicode汉字转换unicode汉字转换unicode汉字转换
excel 公式 自动转换unicode编码为汉字
关于GBK和Unicode字符集转换乱码问题
Unicode编码所有汉字,解压后打开cmd程序,电脑必须安装java
该工具支持汉字和unicode之间的相互转换器
Unicode汉字编码表.rar Unicode汉字编码表.rar Unicode汉字编码表.rar Unicode汉字编码表.rar Unicode汉字编码表.rar Unicode汉字编码表.rar
汉字编码转换工具,实现了汉字与 utf-8 gb2312 unicode 互转,开发者多百多度 qq:547170882
unicode汉字和拼音对照表,按照: 汉字 编码 拼音声标 拼音声调(声调在字母后)声调在拼音后 纯拼音 的格式排列。一共是20902个汉字编码范围是 U4e00 ~ U9fa5.
就是从String转换成Unicode和从Unicode转换成String编码转换
PowerBuilder9.0开发环境下,可以把UTF-8的编码转换为Unicode的编码格式,在pb9.0环境下测试通过。
实现Unicode和汉字的互相转码,解压后excel文档直接转换,方便快捷。
小巧好用的编码转换工具,输入中文,一点按钮就出来转换后的unicode
Unicode和GBK编码转换表,GSM中文字库开发的好工具 以前的不能下载现在重新上传一个