`
wujiandong
  • 浏览: 43166 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

计算机相关知识之字符编码集

阅读更多
计算机里的文件、数据、图片等文件对于我们人来说都只是表面现象,其所有文件在底层都是二进制文件,即全部都是字节码。
对于文本文件而言,之所以我们可以看到一个一个的字符,这完全是因为各个操作系统都会将底层的字节序列转换成字符序列的缘故。
这个转换过程:计算机<-->人中间产生两个概念,就是编码(Encode)和解码(Decode),即然要进行编码与解码,那么就必须要遵守一定的规范.对于文本文件而言,就必须要有相关字符集的支持。
常见的字符集如下:
1:ASCII:美国信息互换标准代码[单字节]
2:GB2312:中华人民共和国国家汉字信息交换用汉字编码集,也就是"国标码"GB
3:GBK:对GB2312的扩展,也就是国标扩展码,包括了一些不常用的字,符号等.
4:ISO-8859-1:是西方国家所使用的字符编码,是一种单字节的字符集,英文只用了其中数字小于128的部分
5:Unicode:是一种通用的字符集,对所有语言的文字进行了统一编码,对每一个字符都用了2个字节,所以传输英文网页的时候效率不高
6:UTF-8:能够用于全世界的字符,是一种不等长的编码,对于中文是用三个字节,对于英文只用一个字节,所以这个编码用的最广泛

Windows系统默认使用字符集:GBK
Ubuntu系统默认使用字符集:UTF-8
java使用Unicode表示字符串和字符,Unicode使用两个字节来表示一个字符.即一个字符占16位
0
0
分享到:
评论

相关推荐

    字符集相关知识

    由于我们的文字中存在着大量的重复字符,而计算机天生就是用来处理数字的,为了减少我们需要保存的信息量,我们可以使用一个数字编码来表示每一个字符,通过对每一个字符规定一个唯一的数字代号,然后,对应每一个...

    GB2311 UNICODE字符集以及字符编码知识了解

    字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。早期的计算机使用7位的ASCII编码,为了处理汉字,程序员设计了用于简体中文的GB2312和用于繁体中文的big5....

    各种字符编码详解.doc

    这里总结了一下字符编码的一些普及性的知识,希望对大家有所帮助。 还是得从ASCII码说起 说到字符编码,不得不说ASCII码的简史。计算机一开始发明的时候是用来解决数字计算的问题,后来人们发现,计算机还可以做更...

    计算机编码与Unicode(PPT课件)

    这个PPT课件介绍了Unicode和字符编码相关的知识。丰富生动的图片和讲解使您能快速地掌握Unicode编码相关的知识,是不可多得的Unicode相关的PPT教程。 内容提要: ----------------- 1. 计算机编码 2. 内码、字形...

    Python之字符串和编码共13页.pdf.zip

    Python之字符串和编码共13页.pdf.zip

    计算机基础知识.doc

    通常是按计算机中硬件所采用的电子逻辑器件划分成电子管、晶体管、中小规模集 成电路、大规模超大规模集成电路四个阶段; 也有一种观点把计算机的发展大致分为四个时期,即大型机时期、小型机时期、 PC 时期(或...

    计算机应用基础知识.doc

    计算机中字符数据的表示方式 字符数据主要指西文的 A SCII 码和汉字,计算机内是用什么代码表示的 A SCII 码:用 7 位二进制数表示的或用一个字节表示,最高位为 0 这是事实上的国际标准。 汉字编码:用连续的两个...

    UNICODE 基础知识.pdf

    早期的UNICODE 版本里,认为UNICODE 应该是一个固定长度的字符集,用一个16 位的整数来表示一个字符,也就是说一个UNICODE 字符占用2 个字节的存储空间。一个 16 位的整数的范围是0~65535,所以早期版本的UNICODE ...

    中职计算机应用基础习题集及答案(2).doc

    第一局部 理论练习题 计算机根底知识 一、填空题 1.目前普遍使用的微型计算机属于第 代计算机,其元件采用了 电路技术。 2.计算机系统包括 系统及 系统。 3.通常可把软件分成两大类,即 和 。 4.CPU是指 ,CAD是...

    中职计算机应用基础习题集与答案.docx

    理论、实习练习集 中职计算机应用基础习题集与答案 34 . z. 第一部分 理论练习题 计算机基础知识 一、填空题 1.目前普遍使用的微型计算机属于第代计算机,其元件采用了电路技术。 2.计算机系统包括系统及系统。 3...

    计算机基础关键字汇总——计算机资料文档.docx

    CAL 辅助学习、CAI辅助教学 汉字存储 2个字节 西文字符存储 1个字节 西文字符 ASCII码、EBCDIC码 汉字编码 国标码、区位码、机内码(多选) 汉字字符集 GB2312、GBK、CJK、BIG5 计算机汉字 机内码 计算机的命令 指令...

    中职计算机应用基础习题集及答案.doc

    第一部分 理论练习题 计算机基础知识 一、填空题 1.目前普遍使用的微型计算机属于第 代计算机,其元件采用了 电路技术。 2.计算机系统包括 系统及 系统。 3.通常可把软件分成两大类,即 和 。 4.CPU是指 ,CAD是...

    中职计算机应用基础习题集及答案(1).doc

    第一部分 理论练习题 计算机基础知识 一、填空题 1.目前普遍使用的微型计算机属于第代计算机,其元件采用了电路技术。 2.计算机系统包括系统及系统。 3.通常可把软件分成两大类,即和。 4.CPU是指,CAD是指。 5...

    中职计算机应用基础习题集及答案(3).doc

    第一部分 理论练习题 计算机基础知识 一、填空题 1.目前普遍使用的微型计算机属于第 代计算机,其元件采用了 电路技术。 2.计算机系统包括 系统及 系统。 3.通常可把软件分成两大类,即 和 。 4.CPU是指 ,CAD是...

    在通用字符集UCSS中藏文编码模式的应用分析 (2008年)

    藏文在通用字符集UCS中如何进行编码,是藏文软件开发者在现代计算机系统中处理藏文数据所必须具备的知识之一。在设计藏文网页内容、UCS藏文数据的整理、设计藏文应用软件、藏文文本的处理操作、在设计藏文Open Type...

    哈夫曼编码-数据结构-C++程序.doc

    数据结构课程设计 一、目的 《数据结构》是一门实践性较强的软件基础课程,为了学好这门课程,必须在掌握理 论知识的同时,加强上机实践。本课程设计的目的就是要达到理论与实际应用相结合, 使同学们能够根据数据...

    信息技术中考知识点.doc

    计算机才能识别各种信息,建立数据与代码间的关系就是编码,目 前英文字母、数字符号广泛采用的编码规则是美国信息交换标准代码,简称ASCII码,我 国汉字采用的编码为GB-2312- 80(1981年公布)码(汉字国标码)2005...

Global site tag (gtag.js) - Google Analytics