`

文件的字节顺序记号

阅读更多

字节顺序记号 是编码为 U+FEFF统一码 字符("零宽度无断空白")。当以 UTF-16 或 UTF-32 来对UCS 或Unicode字符编码时,这个字符被用来标示其字节序。它常被用来当做标示文件是 UTF-8 、 UTF-16 或 UTF-32 编码格式的文件记号。


UTF-8 则没有字节顺序的概念。UTF-8编码过的字节顺序记号则被用来标示它是 UTF-8 的文件。它只用来标示一个 UTF-8 的文件,而不用来说明字节顺序。 许多应用程式(包含记事本 )会添加字节顺序记号到 UTF-8 文件中。然而,在有一些Unix系统 中,这种作法则不被建议采用。字节顺序记号在 UTF-8 中被表示为序列 EF BB BF ,对大部分未准备好处理 UTF-8 的 文本编辑器 及 网页浏览器 而言,在 ISO-8859-1 的环境中则会显示 


编码表示 (十六进制 )表示 (十进制)
UTF-8 EF BB BF 239 187 191
UTF-16(大端序) FE FF 254 255
UTF-16(小端序) FF FE 255 254
UTF-32(大端序) 00 00 FE FF 0 0 254 255
UTF-32(小端序) FF FE 00 00 255 254 0 0
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics