`

汉字信息的编码知识

 
阅读更多

1、区位码:GB2312-80字符集,组成一个94*94的矩阵。每一行称为一个“区”,每一列称为一个“位”。一个汉字的区号和位号合在一起构成“区位码”, 区位码的编码范围是:0101~9494

2、国标码国标码=(区位码的十六进制表示)+2020H国标码的取值范围:2121H~7E7EH

3、机内码中文或西文信息在计算机系统中的代码表示称为机内码。ASCII码是一种西文机内码,用一个字节表示。汉字机内码用连续两个字节表示,每个字节的最高位是1。

机内码 = 国标码+8080H =(区位码的十六进制表示)+A0A0H

GB2312-80的机内码编码范围为:A1A1H~FEFEH



4、输入码: 汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码主要分顺序码(无重码)、音码、形码和音形码或形音码四类。

5、字形码:

(1)向量(矢量)法:将汉字分解成笔画,每种笔画使用一段段的直线(向量)近似地表示,这样每个字形都可以变成一连串的向量。

(2)点阵法(字模点阵码):每一个汉字以点阵形式存储在记录介质上,有点的地方为“1”,空白的地方为“0”。

16*16点阵:16*16/8=32字节

24*24点阵:24*24/8=72字节

 

一个汉字字模占用的字节数根据汉字库的汉字大小不同而不同。以HZK16、HZK12点阵字库为例,字模中每一点使用一个二进制位(Bit)表示,如果是1,则说明此处有点,若是0,则说明没有。这样,一个16×16点阵的汉字总共需要16*16/8=32个字节表示,一个12×12点阵的汉字总共需要16*12/8=24个字节表示
字模的表示顺序为:先从左到右,再从上到下,也就是先画左上方的8个点,再是右上方的8个点,然后是第二行左边8个点,右边8个点,依此类推,画满16×16个点。因此,HZK16中汉字在汉字库中具体位置的计算公式为:(94*(qh-1)+(wh-1))*32; HZK12中汉字在汉字库中具体位置的计算公式为:(94*(qh-1)+(wh-1))*24
汉字“房”的机内码为十六进制的“B7BF”,其中“B7”表示区码,“BF”表示位码。所以“房”的区位码为0xB7BF-0xA0A0=0x171F。将区码和位码分别转换为十进制得汉字“房”的区位码为“2331”,即“房”的点阵位于第23区的第31个字的位置,相当于在文件HZK16中的位置为第32×[(23-1)×94+(31-1)]=67136B以后的32个字节为“房”的显示点阵;相当于在文件HZK12中的位置为第24×[(23-1)×94+(31-1)]=50362B以后的24个字节为“房”的显示点阵

分享到:
评论

相关推荐

    中文编码基础知识介绍

    该书详细介绍了GB2312、GBK、BIG5、GB18030、UTF_8字符集等编码,为编码初学者提供了详细信息。

    信息的编码高中信息技术练习题.doc

    信息的编码 序号:4 授课日期:2011年10月24-11月4日 第8-9周 课题:信息的编码 课时:1课时 课型:复习课 [知识解析]: 信息的编码(或称信息的数字化)是计算机进行信息加工的基础。信息分为数值信息 和非数值...

    课件3:1.2信息的编码

    1.了解为什么对信息进行编码 2.重新认识十进制,并能进行知识迁移,对二进制、十六进制有初步理解 3.了解ASCII字符编码和汉字编码 4.了解声音数字化、图像和视频数字化的概念,初步了解多媒体信息编码的

    全国计算机应用基础知识:汉字、字符编码.pdf

    全国计算机应⽤基础知识:汉字、字符编码 (1)计算机中的信息单位 计算机中对信息表⽰的单位有位、字、字长及字节等,它们是⽤来表⽰信息量的⼤⼩的基本概念。 位:计算机中数据存储的最⼩单位是⼀个⼆进制位,简称...

    Python 文件处理 02_编码知识_中文乱码问题解决.mp4

    Python 文件处理 02_编码知识_中文乱码问题解决.mp4

    初一信息技术上册知识点.doc

    初一信息技术上册知识点 第1单元 信息处理与电子计算机 第1课 信息和信息处理 1、信息处理的过程分为(获取、存储、加工、发布、表示)。 2、在计算机内部数据、字符都采用(二进制或二进制编码)来表示,二进制由...

    计算机基础知识-编码表.doc

    计算机基础知识-编码表 模块:计算机基础知识 主题:编码表 关键词:ASCII、Unicode、UTF-8 1、编码表 计算机发明之初,用来解决数字计算的问题,后来人们发现可以做更多的事,但由 于计算机只识" 数",因此人们必须...

    关于汉字编码方面的知识,大部分是询问人工智能机器人得到的回答

    汉字编码知识如果没有专门学习,理解有些困难。我收集的比较全。最好多看几遍。不要钱的。

    汉字编码表

    汉字编码表 基础知识 帮助大家对汉字在计算机中得存储有一定的了解 对学习,以及编程有一定帮助

    2022全国计算机应用基础知识:汉字、字符编码.docx

    2022全国计算机应用基础知识:汉字、字符编码.docx

    信息技术中考知识点.doc

    目 前英文字母、数字符号广泛采用的编码规则是美国信息交换标准代码,简称ASCII码,我 国汉字采用的编码为GB-2312- 80(1981年公布)码(汉字国标码)2005年又公布《信息技术中文编码字符集GB18030- 2005》,在香港、...

    汉字编码常识

    汉字编码常识是用于解决程序开发中程序员统一编码的知识,解决程序出现乱码的问题。

    编码的奥秘___中文版

    本书用大量的篇幅讲述了与计算机原理相关的各种编码方法,并通过数字逻辑电路以及存储器,微处理器的形成,组织及发展阐述了编码的实现。本书还涉及到计算机系统,编程语言的发展,甚至对计算机图形化的相关技术也给...

    eclipse文件编码设置、转换原理与实用工具

    1.介绍了编码的相关知识:编码理论、eclipse编码设置的理解; 2.实用工具(java写的,代码开放,使用请参考“使用示例”包里面的几个用法,代码里面有详尽的说明)用于eclipse编码设置、转换、编码分析: a.批量...

    GB2311 UNICODE字符集以及字符编码知识了解

    字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。早期的计算机使用7位的ASCII编码,为了处理汉字,程序员设计了用于简体中文的GB2312和用于繁体中文的big5....

    编码高清完整中文版

    本书通过数字逻辑电路(包括逻辑与开关、逻辑门电路与触发器、二进制加法器等)以及存储器、微处理器的形成、组织及发展阐述了编码的实现。此外,本书还涉及到计算机系统、操作系统、编程语言等的产生及发展,甚至对...

    AEPR视频编码基础知识解析

    AEPR视频编码基础知识解析 国内很多AE CG资源大部分是国外教程,本套课程已经附带中文字幕,学习无压力。能够让你对AE和PR等等软件的编码有一个全面的了解。

    Python中文本编码官方文件(howto-unicode)

    Python官方解答unicode编码基本知识以及常见问题的处理。对于深入理解Unicode编码十分重要。

Global site tag (gtag.js) - Google Analytics