`
letitbe
  • 浏览: 232458 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

用utf-8还是GBK

    博客分类:
  • java
阅读更多
编码只是表示字符一种方式,字符还是那个字符,只不过其数值表示的不一样而已。字体、样式和用什么编码表示字符没有任何关系。不可能存在UTF-8达不到的效果。除非你处理字符串的方式有问题,例如后台程序写死了一个中文等于两个字节。或者你的css文件编码有问题。例如html用了UTF-8编码,而css文件用了GB编码,又没有用charset指定css的编码等等。而对于前台HTML来说,无论页面什么编码,JavaScript内建的字符串类型是UTF-16编码的,不存在任何问题。 UTF-8的编码是变长的,从1字节(兼容ASCII)到4字节不等。用UTF-8的好处是它能表示任意Unicode字符,而GBK/GB2312做不到,除了不能表示一些外国文字外,一些古老的中文(如康熙字典里的一些字)也不能表示,但在Unicode里就有。后来发展出的GB18030可以表示任意Unicode字符,也是变长编码,兼容GBK,最长4个字节。编码问题是很麻烦的事情,尤其是同一个系统中存在多种编码的情况。由于每种编码表示的字符范围有限,所以转码过程中有可能丢失字符信息。因此,如果你的程序着眼于全球市场,而不仅仅局限于中文用户,或者未来发展有这方面的需求,那么就应该坚持程序内部都使用同一种Unicode编码,如UTF-8,这样以后程序在国际化时就不会存在什么编码问题。
来源: http://news.csdn.net/n/20080509/115815.html

http://blog.cathayan.org/item/1765
http://hedong.3322.org/archives/000355.html
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics