数值,文字,英文字母等都是字符,任何字符进入计算机时,都必须转换为二进制的形式,称为字符编码。
数字字符编码:三种常见编码为BCD编码(有权码),余3码(无权码),格雷码(无权码)。
BCD编码:用4位二进制数进行表示,0=0000,1=0001,... 9=1001.
余3BCD编码: 在BCD的编码基础上,把每个数的代码加上0011后构成。
格雷码: 规则为相邻的两个代码之间只有一位不同。
英文字符编码:ASCII码 美国标准信息交换码,采用7位二进制数表示,低四位为行,高三位为列。
以前经常在书本上背 a = 97, A = 65,现在终于明白为什么了,在7位ASCII代码表里,a的位置是1100001
换成10进制就是64+32+1=97,A=1000001=65。
文字字符编码:文字处理的过程较为复杂,分别需要分解为输入,汉字的存储,输出等环节,且每个环节用的编码也不相同,且关键点在于要进行一系列的编码转换,输入环节所对应的是输入码,存储环节对应的是内部码,输出环节对应的是字形码。
输入码:1.数字编码 2.拼音码 3.字型码
数字编码:对应于国标区位码6763个两级汉字所对应的编码,区位码分94个区,每个区94位。前两位是区位,后两位是字位,特点是无重码,和内码转换方便,前位后位都是10进制数字表示,但难以记忆。
拼音码:通过汉语拼音进行的编码,重码率高,影响速度。
字型码:通过偏旁部首进行的编码,比较典型的是五笔字形,表形码等
内部码:计算机内部处理,存储,传输汉字用的编码。汉字国标码采用4位16进制表示,由于会引起于个别字符内码于ASCII码冲突,所以将两个字节高位为1,用来作为机内码使用。国标码“3473H”等于机内码“B4F3”。
计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。 汉字交换码(国标码)主要用于汉字信息交换,我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示,每个字节用七位码(高位为0),;所有的国标码汉字及符号组成一个94行94列的二维代码表中。在此方阵中,每一行称为一个"区",每一列称为一个"位"。这个方阵实际上组成一个有94个区(编号由01到94),每个区有94个位(编号由01到94)的汉字字符集。每两个字节分别用两位十进制编码,前字节的编码称为区码,后字节的编码称为位码,此即区位码,其中,高两位为区号,低两位为位号。这样区位码可以唯一地确定某一汉字或字符;反之,任何一个汉字或符号都对应一个唯一的区位码,没有重码。如“保”字在二维代码表中处于17区第3位,区位码即为“1703 ”。 国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,;这样就得了一个与国标码有一个相对位置差的代码,;再将这个代码的第一个字节和第二个字节分别加上20H,就得到国标码。如:“保”字的国标码为3123H,它是经过下面的转换得到的:1703D->1103H->+20H->3123H。国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,如“保”字,国标码为31H和23H,而西文字符“1”和“#”的SCII也为31H和23H,现假如内存中有两个字节为31H和23H,;这到底是一个汉字,还是两个西文字符“1”;和“#”?于是就出现了二义性,显然,国标码是不可能在计算机内部直接采用的,于是,;汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,如:由上面我们知道,“保”字的国标码为3123H,前字节为00110001B,后字节为00100011B,高位改1为10110001B和10100011B 即为B1A3H,因此,该字的机内码就是B1A3H。
显然,汉字机内码的每个字节都大于128,这就解决了与西文字符的ASCII码冲突的问题。如上所述,汉字输入码、区位码、;国标码与机内码都是汉字的编码形式,它们之间有着千丝万缕的联系,但其间的区别也是不容忽视的。
字形码:字形码是通过点阵及矢量函数表示的。当需要输入汉字时,利用汉字字形检索程序根据汉字的内码从字模库中找到相应的字形码。
待续。。。。。。
分享到:
相关推荐
第1章 计算机科学基础知识 1.1 考试大纲 (1)数制及其转换 二进制、八进制、十进制和十六进制等常用数制及其相互转换 (2)计算机内数据的表示 数的表示 非数值表示(字符和汉字的表示、声音表示、图像表示)...
计算机技术在生产生活中的应用越来越密切,计算机应用包括科学计算(数值处理)、信息管理(数据处理)、辅助设计与制造、教育信息化、电子商务、人工智能、网络通信等。 了解计算机技术 第5页/共365页 中职计算机应用...
计算机科学基础 1.1 数制及其转换 二进制、十进制和十六进制等常用数制及其相互转换 1.2 数据的表示 数的表示(原码、反码、补码表示,整数和实数的机内表示) 非数值表示(字符和汉字表示、声音...
第一章 计算机基础知识 1.1 概述 1.1.1 计算机的发展 世界上第一台计算机的诞生: 世界上第一台计算机是由美国宾夕法尼亚大学莫尔学院的物理学家莫克利(John Mauchly)和其它工程技术人员一起,首次使用电子管...
第一章 计算机基础知识 1.1 概述 1.1.1 计算机的发展 世界上第一台计算机的诞生: 世界上第一台计算机是由美国宾夕法尼亚大学莫尔学院的物理学家莫克利(John Mauchly)和其它工程技术人员一起,首次使用电子管...
第一章 计算机基础知识 1.1 概述 1.1.1 计算机的发展 世界上第一台计算机的诞生: 世界上第一台计算机是由美国宾夕法尼亚大学莫尔学院的物理学家莫克利(John Mauchly)和其它工程技术人员一起,首次使用电子管...
研究容 在计算机科学中,数据结构是一门研究非数值计算的程序设计问题中计算机的操作对象 (数据元素)以与它们之间的关系和运算等的学科,而且确保经过这些运算后所得到的 新结构仍然是原来的结构类型。 "数据结构...
计算机科学基础知识 1.1数制及其转换 二进制、八进制、十进制和十六进制等常用数制及其相互转换 1.2 计算机内数据的表示 数的表示(补码表示,整数和实数的表示,精度和溢出) 非数值表示(字符和汉字表示...
Visual FoxPuo 程序设计基础 第1章 数据库系统基础知识 数据库基础知识 1.1 数据模型 1.2 数据库系统 1.3 关系数据库 1.4 数据库系统的体系结构与开发工具 1.5 1.1 数据库基础知识 通常,把用计算机对数据进行处理的...
计算机应用基础(全国) 1 第一章 计算机基础知识 1.1 认识计算机 1.1.1 计算机的起源及发展 1、计算机体系结构和元器件的进步决定计算机向前发展的程度。 2、1822 年英国人巴贝奇首先提出来整个计算过程自动化,...
1.2计算机图形学的发展 1.2.1计算机图形学学科的发展 1.2.2图形硬件设备的发展 1.2.3图形软件的发展 1.3计算机图形学的应用 1.3.1计算机辅助设计与制造 1.3.2计算机辅助绘图 1.3.3计算机辅助教学 ...
" " " "科学计算(数值计算) " " " "数据处理(信息处理) " " " "自动控制 " " " "计算机辅助系统 " " " "如计算机辅助设计CAD(Computer Aided Design " " " ") " " " "计算机辅助制造CAM(Computer Aided " " ...
研究内容 在计算机科学中,数据结构是一门研究非数值计算的程序设计问题中计算机的操作对象(数据元素)以及它们之间的关系和运算等的学科,而且确保经过这些运算后所得到的新结构仍然是原来的结构类型。 "数据结构...
他是我国计算机普及和高校计算机基础教育开拓者之一,现任全国高等院校计算机基础教育研究会会长、教育部全国计算机应用技术证书考试委员会主任委员。 谭浩强教授创造了3个世界纪录:(1)20年来他(及和他人合作)...
计算机的产生是20世纪最重要的科学技术大事件之一。世界上的第一台计算机(ENIAC)于1946年诞生在美国宾夕法尼亚大学,到目前为止,计算机的发展大致经历了四代: ① 第一代电子管计算机,始于1946年,结构上以CPU...
首部以C#讲解科学计算的书, 不过目前只有高清版的前四章. 引言 1 第1章 C#程序设计基础 9 1.1 计算机、程序设计与算法 9 1.1.1 计算机结构 9 1.1.2 操作系统 10 1.1.3 机器语言与高级语言 10 1.1.4 ...
那么,现实世界的各种 各样的数据信息怎样才能够存储到计算机的内存中,对存入计算机的数据信息怎样进行 科学处理,这涉及计算机科学的信息表示和数据库的设计问题。数据库设计的目标是为 用户和各种应用系统提供一...
计算机科学基础 1.1 数制及其转换 • 二进制、十进制和十六进制等常用制数制及其相互转换 1.2 数据的表示 • 数的表示(原码、反码、补码、移码表示,整数和实数的机内表示,精度和溢出) • 非数值表示...
他是我国计算机普及和高校计算机基础教育开拓者之一,现任全国高等院校计算机基础教育研究会会长、教育部全国计算机应用技术证书考试委员会主任委员。 谭浩强教授创造了3个世界纪录:(1)20年来他(及和他人合作)...