`
妖术在烧纸
  • 浏览: 9330 次
  • 性别: Icon_minigender_2
  • 来自: 成都
社区版块
存档分类
最新评论

字符编码集所占用的字节数

阅读更多

public class test1{
	public static void main(String [] args)throws UnsupportedEncodingException  {
		
		System.out.println("妖术".getBytes("ISO8859-1").length);
		System.out.println("妖术".getBytes("GBK").length);
		System.out.println("妖术".getBytes("GB2312").length);
		System.out.println("妖术".getBytes("utf-8").length);
	}
	
}
结果:
2
4
4
6


"ISO8859-1"占一个字符
GBK、GBK312占两个字符
utf-8占3个字符
分享到:
评论

相关推荐

    BIG5编码表又称大五码,是繁体中文字符集编码标准,共收录13060个中文字。

    BIG5编码又称大五码,是繁体中文字符集编码标准,共收录13060个中文字。“BIG5采用双字节编码,使用两个字节来表示一个字符。高位字节使用了0x81-0xFE,低位字节使用了0x40-0x7E,及0xA1-0xFE。在BIG5的分区中: 8140-A0...

    众多字符集编码的区别Unicode向GB2312转换方法说明及示例

    众多字符集编码的区别Unicode向GB2312转换方法说明及包括ASCII码部分及GB2312字符集。 ASCII码部分为128个字符,GB2312字符集为7445个字符。 ASCII码部分不需要用映射表。 GB2312 table可分为4段,每段都是连续的。...

    字符编码学习

    上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系,做了统一规定。这被称为ASCII码,一直沿用至今。 ASCII码一共规定了128个字符的编码,比如空格“SPACE”是32(二进制00100000),大写...

    详解mysql中的字符集和校验规则

     这个字符集使用1个字节进行编码,一个字节具有8位,总共可以保存128个字符,具体的对应关系如下: latin字符集  latin字符集一共可以保存256个字符,相比ASCII码,它又包含了128个西欧常用字符。 GB2312字符集 ...

    python中字符串的编码与解码详析

    GBK:国家简体中文字符集和繁体字符集,兼容ASCII,占两个字节 Unicode:能够表示全世界上所有的字符,Unicode有人说占4个字节也有人说占2个字节,但中文占2个字节 UTF-8:Unicode的压缩版,占1~3个字节,其中...

    conv_gbk_ibm1388:GBKIBM1388字符集转换

    这两个字符集不能通过像Unicode在UTF-8和UTF-16之间所做的操作来直接互换。 它们基于具有不同汉字顺序的不同编码(ASCII / EBCDIC)。 ICU( )支持两种字符集,但占用空间很大。 这是一种占地面积小,快速的解决...

    Java程序设计基础:字符数据类型.pptx

    字符内部Unicode字符编码,占2个字节,可表示0~216-1(65535)个字符,通常用一对单引号引用,如:‘a’,‘5’等。 字符数据类型(char) ASCII 码是 Unicode 码的一个子集,用 Unicode 表示 ASCII 码时,可表示其前...

    GB2312编码对照表

    GB2312简体中文编码表 GB2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682...区和位分别占用一个字节。

    PHP自动识别字符集并完成转码详解

    因为自己使用字符编码一般的是utf-8编码,但如果对方的博客使用gb2312编码的话,POST过来就会出现乱码(除非对方POST前先转换编码)。在不能保证对方是否一定使用utf-8编码的情况下,自己做一个编码的检查和转换是很...

    Python中文字符串截取问题

    占4个字节的:中日韩超大字符集里面的汉字,有5万多个 一个UTF-8数字占1个字节 一个UTF-8英文字母占1个字节 在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,...

    mysql存储emoji表情步骤详解

    Caused by: java.sql.SQLException: Incorrect string value: ‘\xF0\x9F\x94\xA5’ for column Emoji...Mysql设置字符编码集为utf8mb4,对应的库、表、字段设置为utf8mb4,注意如果是已经存在的表utf8编码集修改为utf8

    关于PHP自动判断字符集并转码的详解

    而英文不 管在何种编码情况下,都是小于128,只占用一个字节(全角除外)。如果是文件形式的编码检查,还可以直接check utf-8的BOM信息。话不多说,直接上函数,这个函数是用来对字符串进行检查和转码的。复制代码 ...

    详解字符串在Python内部是如何省内存的

    每个标准 Unicode 字符占用 4 个字节。这对于内存来说,无疑是一种浪费。 Unicode 是表示了一种字符集,而为了传输方便,衍生出里如 utf8 , utf16 等编码方案来节省存储空间。Python内部存储字符串也采用了类似的...

    详谈PHP编码转换问题

    Unicode是一个字符集,而UTF-8是Unicode的其中一种,Unicode是定长的都为双字节,而UTF-8是可变的,对于汉字来说Unicode占有的字节比UTF-8占用的字节少1个字节。Unicode为双字节,而UTF-8中汉字占三个字节。 UTF-8...

    PHP如何实现Unicode和Utf-8编码相互转换

    Unicode是一个字符集,而UTF-8是Unicode的其中一种,Unicode是定长的都为双字节,而UTF-8是可变的,对于汉字来说Unicode占有的字节比UTF-8占用的字节少1个字节。Unicode为双字节,而UTF-8中汉字占三个字节。 UTF-8...

    UNICODE 基础知识.pdf

    位的整数来表示一个字符,也就是说一个UNICODE 字符占用2 个字节的存储空间。一个 16 位的整数的范围是0~65535,所以早期版本的UNICODE 最多只能支持65535个字符。但 是世界上的文字何其多?单单是汉字就不止6 万个...

    VC++6.0核心编程源码.rar

    ”你会发现它与WinError.h头文件中的错误代码2所指的字符串是相同的。 图1-1 在Visual Studio 6.0的Watch窗口中键入 “@err,hr",你就可以查看当前线程的最后错误代码。 Visual studio还配有一个小的实用程序,...

    中职计算机应用基础习题集与答案.docx

    一个半角字符在存储器中占个字节,一个汉字在存储器中占个字节。 6.计算机中的运算器,具有运算和运算的能力。 7.根据存储器的功能或工作方式,可分为和两大部分。 8.按存储器是否直接与CPU交换信息,可分为和两...

    php MD5 base64 crypt等加密函数用法集.rar

    包括了MD5 base64 crypt Sha1等。一些用法说明如下:  var_dump(md5('zxcasd',$raw_output=true)); //raw_output为可选参数如果被设置...//base64_encode()可以让中文和图片顺利在网上传输,但是编码后多占33%的空间。

    计算机概论-平时作业.docx

    答:计算机常用编码如下: 1>Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一 2>ASCll字符集:美国信息互换标准代码,是基于罗马字母表的一套电脑编码系统,主要显示英语和一些西欧语言,是现今最通用 的...

Global site tag (gtag.js) - Google Analytics