`
Sky_257
  • 浏览: 14016 次
  • 性别: Icon_minigender_1
  • 来自: 青岛
社区版块
存档分类
最新评论

unicode标准简介

阅读更多
   
                                  官方说法
     Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
     Unicode 是为了解决传统的字符编码方案的局限而产生的,例如ISO 8859所定义的字符虽然在不同的国家中广泛地使用,可是在不同国家间却经常出现不相容的情况。很多传统的编码方式都有一个共同的问题,即容许电脑处理双语环境(通常使用拉丁字母以及其本地语言),但却无法同时支援多语言环境(指可同时处多种语言混合的情况)。
     Unicode 编码包含了不同写法的字,如“a / a”、“強/强”、“戶/户/戸”。然而在汉字方面引起了一字多形的认定争议。
     在文字处理方面,统一码为每一个字符而非字形定义唯一的代码(即一个整数)。换句话说,统一码以一种抽象的方式(即数字)来处理字符,并将视觉上的演绎工作(例如字体大小、外观形状、字体形态、文体等)留给其他软件来处理,例如网页浏览器或是文字处理器。
目前,几乎所有电脑系统都支持基本拉丁字母,并各自支持不同的其他编码方式。Unicode为了和它们相互兼容,其首256字符保留给ISO 8859-1所定义的字符,使既有的西欧语系文字的转换不需特别考量;并且把大量相同的字符重复编到不同的字符码中去,使得旧有纷杂的编码方式得以和Unicode编码间互相直接转换,而不会遗失任何资讯。举例来说,全角格式区段包含了主要的拉丁字母的全角格式,在中文、日文、以及韩文字形当中,这些字符以全角的方式来呈现,而不以常见的半角形式显示,这对竖排文字和等宽排列文字有重要作用。
在表示一个Unicode的字符时,通常会用“U+”然后紧接着一组十六进制的数字来表示这一个字符。在基本多文种平面(英文为 Basic Multilingual Plane,简写 BMP。它又简称为“零号平面”, plane 0)里的所有字符,要用四位十六进制数(例如U+4AE0,共支持六万多个字符);在零号平面以外的字符则需要使用五位或六位十六进制数了。旧版的Unicode标准使用相近的标记方法,但却有些微的差异:在Unicode 3.0里使用“U-”然后紧接着八位数,而“U+”则必须随后紧接着四位数。
                           
                                个人认为
       用一定位数的二进制把所有的字符都一一对应起来。是否和键盘敲进去的二进制一样?
分享到:
评论

相关推荐

    segments:Unicode 标准标记化例程和正字法配置文件分段

    segment 包提供了 Unicode 标准标记化例程和正字法分段,实现了The Unicode Cookbook (Moran and Cysouw 2018) 中的正字法配置文件规范中描述的线性算法 )。 命令行使用 创建一个文本文件: $ echo "aäaaöaaü...

    Text转UTF8.vi

    简介:UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,由Ken Thompson于1992年创建,现在已经标准化为RFC 3629。UTF-8用1到4个字节编码Unicode字符。

    汇编语言。rar

    目 录 第I部分 基 础 知 识 第1章 起步 3 ...第2章 Unicode简介 19 2.1 字符集简史 19 2.1.1 美国标准 20 2.1.2 美国以外的世界 21 2.1.3 扩展ASCII 21 2.1.4 双字节字符集 23 2.1.5 Unicode的解救方案 24

    深入理解C++11

    《深入理解C++11:C++11新特性解析与应用》内容简介:国内首本全面深入解读C++11新标准的专著,由C++标准委员会代表和IBM XL编译器中国开发团队共同撰写。不仅详细阐述了C++11标准的设计原则,而且系统地讲解了C++11...

    深入理解c++11新特性解析与应用

    《深入理解C++11:C++11新特性解析与应用》内容简介:国内首本全面深入解读C++11新标准的专著,由C++标准委员会代表和IBM XL编译器中国开发团队共同撰写。不仅详细阐述了C++11标准的设计原则,而且系统地讲解了C++11...

    深入理解c++11

    《深入理解C++11:C++11新特性解析与应用》内容简介:国内首本全面深入解读C++11新标准的专著,由C++标准委员会代表和IBM XL编译器中国开发团队共同撰写。不仅详细阐述了C++11标准的设计原则,而且系统地讲解了C++11...

    C++11新特性解析与应用 高清书签版

    《深入理解C++11:C++11新特性解析与应用》内容简介:国内首本全面深入解读C++11新标准的专著,由C++标准委员会代表和IBM XL编译器中国开发团队共同撰写。不仅详细阐述了C++11标准的设计原则,而且系统地讲解了C++11...

    Python核心编程(第二版).pdf (压缩包分2部分,第二部分)

     5.1 数字简介   5.1.1 如何创建数值对象并用其赋值(数字对象)   5.1.2 如何更新数字对象   5.1.3 如何删除数字对象   5.2 整型   5.2.1 布尔型   5.2.2 标准整型   5.2.3 长整型   ...

    Python核心编程(第二版).pdf (压缩包分2部分,第一部分)

     5.1 数字简介   5.1.1 如何创建数值对象并用其赋值(数字对象)   5.1.2 如何更新数字对象   5.1.3 如何删除数字对象   5.2 整型   5.2.1 布尔型   5.2.2 标准整型   5.2.3 长整型   ...

    Python核心编程第二版(ok)

     5.1 数字简介   5.1.1 如何创建数值对象并用其赋值(数字对象)   5.1.2 如何更新数字对象   5.1.3 如何删除数字对象   5.2 整型   5.2.1 布尔型   5.2.2 标准整型   5.2.3 长整型   ...

    Python核心编程第二版

     5.1 数字简介   5.1.1 如何创建数值对象并用其赋值(数字对象)   5.1.2 如何更新数字对象   5.1.3 如何删除数字对象   5.2 整型   5.2.1 布尔型   5.2.2 标准整型   5.2.3 长整型   ...

    Windows 程序设计(第5版)(上、下册)--详细书签版

    第二章 unicode简介 2.1 字符集简史 . 2.1.1 美国标准 2.1.2 国际方面 2.1.3 扩展ascll 2.1.4 双字书字符集 2.1.5 unicode解决方案 2.2 宽字符和c 2.2.1 char数据类型 2. 2. 2 宽字符 ...

    笨笨钟,让您爱不释手的时钟软件

    功能简介: 1、这是一款界面精美,操作简便,功能强大,让您爱不释手的免费时钟软件。 2、能以石英钟,数字钟两种方式显示时钟,超强抗锯齿,使得显示更加平滑,美观。 3、70多款精美皮肤可供选择,可为圆形、...

    Python 核心编程 第二版

    内容简介 本书是经典的Python指导书,在第一版的基础上进行了全面升级。全书分为两个部分:第1部分占据了大约三分之二的篇幅,阐释这门语言的“核心”内容,包括基本的概念和语句、语法和风格、 Python对象、数字...

    Python中encode()方法的使用简介

    对于所有的编码方案的列表,请访问:标准编码库 errors — 这可能是给定一个不同的错误处理机制。默认的错误是“严格”,即编码错误提出UnicodeError。其他可能的值是ignore’, ‘replace’, ‘xmlcharrefreplace’...

    Python 中文手册

    3. Python 简介 3.1. 将 Python 当做计算器 3.1.1. 数字 3.1.2. 字符串 3.1.3. 关于 Unicode 3.1.4. 列表 3.2. 编程的第一步 4. 深入 Python 流程控制 4.1. if 语句 4.2. for 语句 4.3. The range() 函数 4.4. break...

    FTBDF字模点阵字提取工具软件

    FTDBF 字摸提取工具软件简介: 举例: 可将将字符编码区间:[A1,B1] 字体:C1,字体大小:D1的字符,……,[An,Bn],字体:Cn,字体大小:Dn字符提取为宽度为En,高度为Fn的字摸。并且可以调整字符在字摸中的位置(通过...

    The Art of Assembly Language

    2.16 Unicode字符集 2.17 更多信息 第3章 存储器的访问与结构 3.1 本章概述 3.2 80x86的寻址方式 3.3 运行时存储器的结构 3.4 HLA如何为变量分配内存 3.5 HLA对数据对齐的支持 3.6 地址表达式 3.7 类型强制转换 3.8 ...

Global site tag (gtag.js) - Google Analytics