`
linxizeng
  • 浏览: 102265 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Tiger学习 之 Unicode

阅读更多
先来了解什么是Unicode和一些概念?
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。

codepoint 代表特定字符的数字。例如 0x3c0 是 π codepoint
引用

int s = 0x3c0;
System.out.println((char)s);
输出:π


Tiger之前的Java版本支持Unicode 3.0,所有Unicode字符容于16位(也就是一个char),而Tiger改为支持Unicode4.0(大部分新字符是汉字),它定义了不能容于16位的字符,这些字符不能容于一个char,这时我们用int类型的codePoint来表示该字符。如Character类的一些新方法支持..
引用

Tiger之前
Character.toLowerCase(char ch)

Tiger(多了支持传codepoint的方法)
Character.toLowerCase(int codePoint)




PS:是不是有写中文字在Tiger之前,不能放在char型中,在Tiger可以放在int型来实现。
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics