Java中char到底是多少字节？

全部 Hibernate Spring Struts iBATIS 企业应用 Lucene SOA Java综合 Tomcat 设计模式 OO JBoss

浏览 57687 次

锁定老帖子主题：Java中char到底是多少字节？精华帖 (2) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
vlinux 等级: 性别: 文章: 385 积分: 332 来自: 火星	发表时间：2007-01-16 相关推荐: java中的char占几个字节实例分析 java char字节数_Java中char到底是多少字节？ char几个字节java_java中char占几个字节？ Java中Char占用几个字节？？？ java char大小_java char占用多少字节？更多相关推荐貌似一个简单的问题（也许还真是简单的）但是却把曾经自认为弄清楚的我弄得莫名其妙 char在Java中应该是16个字节 byte在Java中应该是8个字节 char x = '编'; //这样是合法的，输出也是16个字节但是 String str = "编"; byte[] bytes = str.getBytes(); //我想不明白，为什么这里要占用3个byte呢? 3个byte一共是3*8=24个字节，那么char x怎么又放得下？我坚信char是16个字节，但是str.getBytes()这个东西到底又怎么回事？不好意思，表达有点乱，但是的确太奇怪了。希望大家能指点一下。声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

skydream 等级: 性别: 文章: 483 积分: 1157 来自: 广州	发表时间：2007-01-16 首先，java中的一个char的确是2个字节。java采用unicode，2个字节来表示一个字符。其次，楼主你说的byte[] bytes = str.getBytes();之后是3个字节，这里和前面的概念不一样。java是用unicode来表示字符，"编"这个中文字符的unicode就是2个字节。String.getBytes(encoding)方法是获取指定编码的byte数组表示，通常gbk/gb2312是2个字节，utf-8是3个字节。如果不指定encoding则取系统默认的encoding. 另外，楼主的“字节”说的有点乱，通常我们说的字节是指byte,还有一个"位"的概念(bit)，通常情况下1 byte=8 bit. "3个byte一共是38=24个字节"这句话应该表示为“3个byte一共是38=24个bit”
返回顶楼	回帖地址 2 0 请登录后投票

kdekid 等级: 文章: 87 积分: 136	发表时间：2007-01-16 首先，要搞清楚 code point 和 encoding 的区别。Java 是遵循 unicode 4.0 标准的，而内部的 character 以 utf-16 作为 encoding。unicode 4.0 标准包含从 U+0000-U+FFFF 的基本多语言平面和 U+10000-U+10FFFF 的扩展平面的文字，这是 code point。Java 的 char 类型是 16 bit 的，所以单个 char 只支持基本平面内的文字，而扩展平面的文字是由一对 char 来表示的。而 String.getBytes() 这个方法是按照指定的 encoding 返回字符串，一般中文系统的默认编码是 utf-8 (linux, mac) 或者 gbk/gb18030 (windows)。只要是基本平面内的文字，utf-8码的中文都是3字节的，而 gbk/gbk18030 是2字节的。
返回顶楼	回帖地址 0 0 请登录后投票

vlinux 等级: 性别: 文章: 385 积分: 332 来自: 火星	发表时间：2007-01-16 恩，谢谢指教，我当初的确是慌张了，字节和位都弄混了谢谢楼上两位的赐教。
返回顶楼	回帖地址 0 0 请登录后投票

skydream 等级: 性别: 文章: 483 积分: 1157 来自: 广州	发表时间：2007-01-16 kdekid的说法比较专业，俺的描述土了点....
返回顶楼	回帖地址 0 0 请登录后投票

sleeplessljy 等级: 初级会员性别: 文章: 11 积分: 32 来自: 苏州	发表时间：2007-01-16 谢谢楼上的，学到东西了
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → Java企业应用版

跳转论坛: