转自: http://longtangwan.iteye.com/blog/619700
依据编码形式:
GB-231280 编码为 2个字节(Byte) 包含了 20902 个汉字,其编码范围是 0x8140-0xfefe。
GB18030-2000(GBK2K) 在 GBK 的基础上进一步扩展了汉字,增加了藏、蒙等少数民族的字形。编码是变长的,其二字节部分与 GBK 兼容;四字节部分是扩充的字形、字位,其编码范围是首字节 0x81-0xfe、二字节0x30-0x39、三字节 0x81-0xfe、四字节0x30-0x39
Unicode 范围一般所用为\U0000-\UFFFF,对于CJK EXT B区汉字,范围大于\U20000
UTF, 按其基本长度所用位数分为UTF-8/16/32。其中:
UTF-8是变长编码,每个Unicode代码点按照不同范围,可以有1-3字节的不同长度,一般为3个字节。
UTF-16长度相对固定,只要不处理大于\U200000范围的字符,每个Unicode代码点使用16位即2字节表示,超出部分使用两个UTF-16即4字节表示。按照高低位字节顺序,又分为UTF-16BE/UTF-16LE。
UTF-32长度始终固定,每个Unicode代码点使用32位即4字节表示。按照高低位字节顺序,又分为UTF-32BE/UTF-32LE。
* 在hibernate中length=?的长度跟oracle varchar2(?)定义的长度相同,都表示?字节,但是必须在jsp页面中控制字符的长度,因为输入框检查一个中文算一个字符长度,但如果存到数据库中一个中文就是2~3个字节,因此必须控制中文字符的总数使之转换成字节时不超过数据库的最大长度。
*因此在数据库中定义varchar2(4000),则在界面最多只能存1333个中文(编码为utf-8),因为此编码下一个中文就是3个字节。
分享到:
相关推荐
针对Oracle数据库中汉字在不通的字符集下所占字符长度不通,在保存时可能需要对源字符串的长度进行判断。 实现过程如下 /** * 针对汉字 进行计算长度 * @param string 计算的字符串 * @param ...
一个JS函数,可以获取你当前输入的字符串的长度,其中中文字符和全角字符是2个长度
$("input").inputlimit(options... gbk: true //中文字符是否占用2长度 }, numeric: { //数字/小数设置 allowdec: 0, //小数位,-1:无小数,0:不限制小数位,>0:具体位数 negative: 0 //允许负数 1:允许,0:不允许 } }
JavaScript 中关于字符串字节长度的计算比较(含汉字字符串) 可用于验证字符串长度。效率比较高。
JS的字符串都是string对象,可以用string对象的length属性可以获取其长度,但是无论是中文、全角符号以及英文最小长度单位都是1,这与php的strlen()并不相同。 代码如下: function strlen(str) { var s = 0; for(var...
字符数统计 中文英文字符分开统计 delphi 源码
获取中文字符串长度的函数(VB6.0源代码编写)获取中文字符串长度的函数,输入汉字,计算机将会计算汉字长度Function CLen(ByVal mystr As String) As Integer
初学者pb实现测字符长度 和计算器的实现 初学者很好的学习资源
获取中文字符串长度的函数(VB6.0代码编写) 获取中文字符串长度的函数,输入汉字,计算机将会计算汉字长度 QQ223857666勾月
我们在实际过程中要经常去检测含有中文字符串的实际长度, 因为中文字符,和英文字符在一起的话.判断起来你麻烦点. 原理跟在asp中的一样.逐个去判断.是中文加2英文加1. 代码如下:ASCIIEncoding n = new ...
VC++限制编辑框输入文本的长度,也就是像WEB表单中的输入框功能类似,限制用户输入字符的数量,这样可以预防用户输入了超过规定限制的字符数量,有效避免程序出错。在本例的输入框中,中允许用户输入7个字符,再多...
正常情况下,我们是直接去string的length的,但是汉字是有两个字节的,所以直接用length是错的。如下图: 所以应该用以下代码来获取长度: private void button1_Click(object sender, EventArgs e) { string s ...
使用GDI32中API计算字符串的精确象素长度
js计算字符串长度,可以输入中文、英文、数字、中英文数字混合等,最后计算结果为字符串所占字节个数
判断汉字函数.c 函数功能:检查指定长度字符串中汉字的完整性
获取中文字符串长度的函数(VB6.0代码编写)
自己输入一个字符串,字符串中可以包括字符和汉字,截取指定的字符串
wcslen(str) 无法判断超大字符集的汉字个数. 使用此头文件可以正确获得汉字长度; 开发语言:C.
除了将记录导出到word方法外(word要把“允许西文在单词中间换行"勾上),笔者写了一个自定义函数,可将字符按用户指定的字节长度参数分割成等长字符,调用时用test(字符串,字节长度)即可,比如字符为”CSDN是个...
做过大型网站前台的Web开发程序员最头疼的事情就是前台首页的布局,这其中最最头疼的就是标题字符的截取的问题,虽然有fn:substring,但表现率以及对中文的支持均不够完善,其实最终还是归结为客户要求太高了,不过...