转自:http://hi.baidu.com/johnson2050/item/5be9bff0a1bac013d6ff8c2a
英文字母:
字节数 : 1;编码:GB2312
字节数 : 1;编码:GBK
字节数 : 1;编码:GB18030
字节数 : 1;编码:ISO-8859-1
字节数 : 1;编码:UTF-8
字节数 : 4;编码:UTF-16
字节数 : 2;编码:UTF-16BE
字节数 : 2;编码:UTF-16LE
中文汉字:
字节数 : 2;编码:GB2312
字节数 : 2;编码:GBK
字节数 : 2;编码:GB18030
字节数 : 1;编码:ISO-8859-1
字节数 : 3;编码:UTF-8
字节数 : 4;编码:UTF-16
字节数 : 2;编码:UTF-16BE
字节数 : 2;编码:UTF-16LE
可以通过代码看出以上结果:
import java.io.UnsupportedEncodingException;
public class EncodingTest {
/**
* @param args
*/
public static void main(String[] args) {
String en = "A";
String ch = "人";
System.out.println("英文字母:" + en);
printByteLength(en, "GB2312");
printByteLength(en, "GBK");
printByteLength(en, "GB18030");
printByteLength(en, "ISO-8859-1");
printByteLength(en, "UTF-8");
printByteLength(en, "UTF-16");
printByteLength(en, "UTF-16BE");
printByteLength(en, "UTF-16LE");
System.out.println();
System.out.println("中文汉字:" + ch);
printByteLength(ch, "GB2312");
printByteLength(ch, "GBK");
printByteLength(ch, "GB18030");
printByteLength(ch, "ISO-8859-1");
printByteLength(ch, "UTF-8");
printByteLength(ch, "UTF-16");
printByteLength(ch, "UTF-16BE");
printByteLength(ch, "UTF-16LE");
}
/**
* 打印不同字符集下Java字符串所占的字节数
*
* @param str
* 待操作的字符串
* @param encodingName
* 字符集名称
* */
public static void printByteLength(String str, String encodingName) {
System.out.print("字节数 : ");
try {
System.out.print(str.getBytes(encodingName).length);
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
System.out.println(";编码:" + encodingName);
}
}
分享到:
相关推荐
例如一个英文字母 "a" 和 一个汉字 "好",编码后都是占用的空间大小是一样的,都是两个字节! Unicode可以用来表示所有语言的字符,而且是定长双字节(也有四字节的)编码,包括英文字母在内。所以可以说它是不...
占4个字节的:中日韩超大字符集里面的汉字,有5万多个 一个UTF-8数字占1个字节 一个UTF-8英文字母占1个字节 在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,...
mb_strlen 可以根据字符集计算长度,比如utf8的中文计数为1,但这不符合微博字数限制需求,中文必须计算为2才可以。google了下,找到一个discuz中截取各种编码字符的类,改造了下,已经测试通过.其中参数$charset 只...
在Windows中,只要选择汉字输入法中的"输入中文符号",则在"中文半角"状态下也可输 出如顿号、引号、句号等全角的中文标点符号。 3. 输入汉字的编码方法有很多种,输入计算机后,都按各自的编码方法存储在计算机...
是中国标准的简体中文字符集,它所收录的汉字已经覆盖99.75%的使用频率,在 中国大陆和新加坡广泛使用。 4>GBK字符集:GB2312 字符集的扩展,它收录了 21886 个符号,它分为汉字区和图形符号区,汉字区包括 21003个...
你可以看到,每个错误都有3种表示法:即一个消息ID(这是你可以在源代码中使用的一个宏,以便与GetLastError的返回值进行比较),消息文本(对错误的英文描述)和一个号码(你应该避免使用这个号码,而应该使用消息...
●输入法: 集成王码五笔字型(86)、拼音、英文字母、数字和符号等输入法。 ●支持以下操作系统: 支持 Android 操作系统2.1 版以及新版本的手机。 使用说明 一.安装: 1.操作系统:支持 Android 2.1 版以及新...
控制总线 3.GB18030-2000《信息技术交换用汉字编码字符集基本集的扩充》共收录汉字 ( ) A.27000多个 B.18000多个 C.6000多个 D.3000多个 4.在计算机存储器的术语中,一个"Byte"包含8个 ( ) A.字母 B....
在ASCII编码字符中,控制字符有个,图形字符(包括常用符号、英文字母、数字符等)有个。 20. 硬盘转速是衡量硬盘性能的一个重要技术指标,目前常见的硬盘转速多为_____________,____________。 二、单项选择题 1....
控制总线 3.GB18030-2000《信息技术交换用汉字编码字符集基本集的扩充》共收录汉字 ( ) A.27000多个 B.18000多个 C.6000多个 D.3000多个 4.在计算机存储器的术语中,一个"Byte"包含8个 ( ) A.字母 B....
在ASCII编码字符中,控制字符有 个,图形字符(包括常用符号、英文字母、数字符等)有 个。 20. 硬盘转速是衡量硬盘性能的一个重要技术指标,目前常见的硬盘转速多为___________ __,____________。 二、单项选择题 ...
在ASCII编码字符中,控制字符有 个,图形字符(包括常用符号、英文字母、数字符等)有 个。 20。 硬盘转速是衡量硬盘性能的一个重要技术指标,目前常见的硬盘转速多为___________ __,____________。 二、单项选择题 1...
在ASCII编码字符中,控制字符有 个,图形字符〔包括常用符号、英文字母、数字符等〕有 个。 20. 硬盘转速是衡量硬盘性能的一个重要技术指标,目前常见的硬盘转速多为___________ __,____________。 二、单项选择题 ...
在ASCII编码字符中,控制字符有 个,图形字符〔包括常用符号、英文字母、数字符等〕有 个。 20. 硬盘转速是衡量硬盘性能的一个重要技术指标,目前常见的硬盘转速多为___________ __,____________。 二、单项选择题 ...
[xyz] 字符集(character set),匹配这个集合中的任一一个字符(或元字符) [^xyz] 不匹配这个集合中的任何一个字符 [\b] 匹配一个退格符 \b 匹配一个单词的边界 \B 匹配一个单词的非边界 \cX 这儿,X是一个控制符,/\...
A、用英文字母“PI”代替B、右击“输入法状态”窗口中的软键盘按钮,然后选择希腊字母键盘 C、用电报码输人法输人 D、在“画笔”中,画出该字,再粘贴到文章中 28.Windows98中的文件系统结构是___C__形状。 A、网状 ...
在微型计算机中, 应用最普遍字符编码是ASCII码。 15.计算机工作原理是程序存放。 16.8个字节含二进制位64。 17.计算机发展各阶段是以作为标志。 18.标准ASCII码用__7位二进制数表示字符, 用来表示128种不一样字符...
控制总线 3.GB18030-2000《信息技术交换用汉字编码字符集基本集的扩充》共收录汉字 ( ) A.27000多个 B.18000多个 C.6000多个 D.3000多个 4.在计算机存储器的术语中,一个"Byte"包含8个 ( ) A.字母 B....