Java中的char类型

wang286480403

浏览: 265376 次
性别:
来自: 上海

最近访客更多访客>>

gxrwdsq

lanfengemail

yonglongwang

xhh_lite

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Java

Java中的char类型

一：char的初始化

char是Java中的保留字，与别的语言不同的是，char在Java中是16位的，因为Java用的是Unicode。不过8位的ASCII码包含在Unicode中，是从0~127的。

Java中使用Unicode的原因是，Java的Applet允许全世界范围内运行，那它就需要一种可以表述人类所有语言的字符编码。Unicode。但是English，Spanish，German, French根本不需要这么表示，所以它们其实采用ASCII码会更高效。这中间就存在一个权衡问题。

因为char是16位的，采取的Unicode的编码方式，所以char就有以下的初始化方式：

char c='c'; //字符，可以是汉字，因为是Unicode编码

char c=十进制数，八进制数，十六进制数等等; //可以用整数赋值

char c='\u数字'; //用字符的编码值来初始化，如：char='\0',表示结束符，它的ascll码是0，这句话的意思和 char c=0 是一个意思。

二：关于char占几个字节的问题如下：

1：“字节”是byte，“位”是bit ；

　　2： 1 byte = 8 bit ；

　　char 在java中是2个字节。java采用unicode，2个字节（16位）来表示一个字符。

　　例子代码如下：

public class Test {  
  
  
    public static void main(String[] args) {  
        String str= "中";  
        char x ='中';  
        byte[] bytes=null;  
        byte[] bytes1=null;  
        try {  
            bytes = str.getBytes("utf-8");  
            bytes1 = charToByte(x);  
        } catch (UnsupportedEncodingException e) {  
            // TODO Auto-generated catch block  
            e.printStackTrace();  
        }  
        System.out.println("bytes 大小："+bytes.length);  
        System.out.println("bytes1大小："+bytes1.length);  
    }  
    public static byte[] charToByte(char c) {   
        byte[] b = new byte[2];   
        b[0] = (byte) ((c & 0xFF00) >> 8);   
        b[1] = (byte) (c & 0xFF);   
        return b;   
    }  
}

运行结果：

bytes 大小：3
bytes1大小：2

java是用unicode来表示字符，"中"这个中文字符的unicode就是2个字节。

String.getBytes(encoding)方法是获取指定编码的byte数组表示，

通常gbk/gb2312是2个字节，utf-8是3个字节。

如果不指定encoding则取系统默认的encoding。

分享到：

HashMap与Hashtable区别 | Hibernate延迟加载带来的session close的 ...

2013-10-18 15:59
浏览 2345
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论