`

英文字母和中文汉字在不同字符集编码下的字节数

 
阅读更多

转自:http://hi.baidu.com/johnson2050/item/5be9bff0a1bac013d6ff8c2a

 

英文字母:

字节数 : 1;编码:GB2312

字节数 : 1;编码:GBK

字节数 : 1;编码:GB18030

字节数 : 1;编码:ISO-8859-1

字节数 : 1;编码:UTF-8

字节数 : 4;编码:UTF-16

字节数 : 2;编码:UTF-16BE

字节数 : 2;编码:UTF-16LE

 

中文汉字:

字节数 : 2;编码:GB2312

字节数 : 2;编码:GBK

字节数 : 2;编码:GB18030

字节数 : 1;编码:ISO-8859-1

字节数 : 3;编码:UTF-8

字节数 : 4;编码:UTF-16

字节数 : 2;编码:UTF-16BE

字节数 : 2;编码:UTF-16LE

可以通过代码看出以上结果:

 

import java.io.UnsupportedEncodingException;

 

public class EncodingTest {

 

/**

* @param args

*/

public static void main(String[] args) {

String en = "A";

String ch = "人";

System.out.println("英文字母:" + en);

printByteLength(en, "GB2312");

printByteLength(en, "GBK");

printByteLength(en, "GB18030");

printByteLength(en, "ISO-8859-1");

printByteLength(en, "UTF-8");

printByteLength(en, "UTF-16");

printByteLength(en, "UTF-16BE");

printByteLength(en, "UTF-16LE");

System.out.println();

 

System.out.println("中文汉字:" + ch);

printByteLength(ch, "GB2312");

printByteLength(ch, "GBK");

printByteLength(ch, "GB18030");

printByteLength(ch, "ISO-8859-1");

printByteLength(ch, "UTF-8");

printByteLength(ch, "UTF-16");

printByteLength(ch, "UTF-16BE");

printByteLength(ch, "UTF-16LE");

}

 

/**

* 打印不同字符集下Java字符串所占的字节数

* @param str

*            待操作的字符串

* @param encodingName

*            字符集名称

* */

public static void printByteLength(String str, String encodingName) {

System.out.print("字节数 : ");

try {

System.out.print(str.getBytes(encodingName).length);

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

}

System.out.println(";编码:" + encodingName);

}

}

分享到:
评论

相关推荐

    字符编码学习

    例如一个英文字母 "a" 和 一个汉字 "好",编码后都是占用的空间大小是一样的,都是两个字节! Unicode可以用来表示所有语言的字符,而且是定长双字节(也有四字节的)编码,包括英文字母在内。所以可以说它是不...

    Python中文字符串截取问题

    占4个字节的:中日韩超大字符集里面的汉字,有5万多个 一个UTF-8数字占1个字节 一个UTF-8英文字母占1个字节 在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,...

    php截取字符串之截取utf8或gbk编码的中英文字符串示例

    mb_strlen 可以根据字符集计算长度,比如utf8的中文计数为1,但这不符合微博字数限制需求,中文必须计算为2才可以。google了下,找到一个discuz中截取各种编码字符的类,改造了下,已经测试通过.其中参数$charset 只...

    “计算机应用基础”习题三.doc

    在Windows中,只要选择汉字输入法中的"输入中文符号",则在"中文半角"状态下也可输 出如顿号、引号、句号等全角的中文标点符号。 3. 输入汉字的编码方法有很多种,输入计算机后,都按各自的编码方法存储在计算机...

    计算机概论-平时作业.docx

    是中国标准的简体中文字符集,它所收录的汉字已经覆盖99.75%的使用频率,在 中国大陆和新加坡广泛使用。 4>GBK字符集:GB2312 字符集的扩展,它收录了 21886 个符号,它分为汉字区和图形符号区,汉字区包括 21003个...

    VC++6.0核心编程源码.rar

    你可以看到,每个错误都有3种表示法:即一个消息ID(这是你可以在源代码中使用的一个宏,以便与GetLastError的返回值进行比较),消息文本(对错误的英文描述)和一个号码(你应该避免使用这个号码,而应该使用消息...

    王码五笔86 for Android

    ●输入法: 集成王码五笔字型(86)、拼音、英文字母、数字和符号等输入法。 ●支持以下操作系统:  支持 Android 操作系统2.1 版以及新版本的手机。 使用说明 一.安装: 1.操作系统:支持 Android 2.1 版以及新...

    1《计算机应用基础》作业及答案.doc

    控制总线 3.GB18030-2000《信息技术交换用汉字编码字符集基本集的扩充》共收录汉字 ( ) A.27000多个 B.18000多个 C.6000多个 D.3000多个 4.在计算机存储器的术语中,一个"Byte"包含8个 ( ) A.字母 B....

    中职计算机应用基础习题集与答案.docx

    在ASCII编码字符中,控制字符有个,图形字符(包括常用符号、英文字母、数字符等)有个。 20. 硬盘转速是衡量硬盘性能的一个重要技术指标,目前常见的硬盘转速多为_____________,____________。 二、单项选择题 1....

    《计算机应用基础》作业及答案.docx

    控制总线 3.GB18030-2000《信息技术交换用汉字编码字符集基本集的扩充》共收录汉字 ( ) A.27000多个 B.18000多个 C.6000多个 D.3000多个 4.在计算机存储器的术语中,一个"Byte"包含8个 ( ) A.字母 B....

    中职计算机应用基础习题集及答案.doc

    在ASCII编码字符中,控制字符有 个,图形字符(包括常用符号、英文字母、数字符等)有 个。 20. 硬盘转速是衡量硬盘性能的一个重要技术指标,目前常见的硬盘转速多为___________ __,____________。 二、单项选择题 ...

    中职计算机应用基础习题集及答案(3).doc

    在ASCII编码字符中,控制字符有 个,图形字符(包括常用符号、英文字母、数字符等)有 个。 20。 硬盘转速是衡量硬盘性能的一个重要技术指标,目前常见的硬盘转速多为___________ __,____________。 二、单项选择题 1...

    中职计算机应用基础习题集及答案(1).doc

    在ASCII编码字符中,控制字符有 个,图形字符〔包括常用符号、英文字母、数字符等〕有 个。 20. 硬盘转速是衡量硬盘性能的一个重要技术指标,目前常见的硬盘转速多为___________ __,____________。 二、单项选择题 ...

    中职计算机应用基础习题集及答案(2).doc

    在ASCII编码字符中,控制字符有 个,图形字符〔包括常用符号、英文字母、数字符等〕有 个。 20. 硬盘转速是衡量硬盘性能的一个重要技术指标,目前常见的硬盘转速多为___________ __,____________。 二、单项选择题 ...

    正则表达式

    [xyz] 字符集(character set),匹配这个集合中的任一一个字符(或元字符) [^xyz] 不匹配这个集合中的任何一个字符 [\b] 匹配一个退格符 \b 匹配一个单词的边界 \B 匹配一个单词的非边界 \cX 这儿,X是一个控制符,/\...

    会计理论考试题

    A、用英文字母“PI”代替B、右击“输入法状态”窗口中的软键盘按钮,然后选择希腊字母键盘 C、用电报码输人法输人 D、在“画笔”中,画出该字,再粘贴到文章中 28.Windows98中的文件系统结构是___C__形状。 A、网状 ...

    2021年计算机应用基础平时作业参考答案.doc

    在微型计算机中, 应用最普遍字符编码是ASCII码。 15.计算机工作原理是程序存放。 16.8个字节含二进制位64。 17.计算机发展各阶段是以作为标志。 18.标准ASCII码用__7位二进制数表示字符, 用来表示128种不一样字符...

    《计算机应用基础》作业及答案.doc

    控制总线 3.GB18030-2000《信息技术交换用汉字编码字符集基本集的扩充》共收录汉字 ( ) A.27000多个 B.18000多个 C.6000多个 D.3000多个 4.在计算机存储器的术语中,一个"Byte"包含8个 ( ) A.字母 B....

Global site tag (gtag.js) - Google Analytics