- 浏览: 138682 次
- 性别:
- 来自: 合肥
文章分类
最新评论
-
tjg138:
many thanks!!!!!
Hibernate QBC查询 -
tjg138:
Criteria criteria=session.creat ...
Hibernate QBC查询 -
wa114d:
能不能把你源码放上啊,谢谢啊
Javamail -
cfyme:
重构过的代码 我去运行 怎么也执行不到EmailRunner中 ...
Javamail -
cfyme:
大师,你有没有源文件 你上传附件不是正确的
Javamail
首先声明一下,此文章时从网上转载的。如下的某些方法是确实管用,但是从中发现了有一点不足,就是原文笔者没考虑使用不同Web Server时出现的情况,比如文章里我用红色字体画出来的部分代码在Tomcat跑的时候得用他说的方法,不过到了WebSphere的时候必须得用原先的
String name = request.getParameter("name");
所以采取本文方法的时候不要太死板,多试试。
在Java编程中,中文字体编码难倒了不少程序员,如果抓住了影响Java中文显示的几个关键因素,问题将迎刃而解。
Java是目前最流行的面向对象的编程语言之一,Java支持UTF-8、ISO-8859-1、GBK等各种字体编码,可是发现Java中字体编码的问题仍难倒了不少程序员,网上虽然也有不少关于在Java中如何正确显示中文的文章,但都不够全面,特意总结如下。
影响Java中字体编码正确显示的有几个因素:
1)数据库的连接方式;
2)网页中使用的字体编码;
3)数据库里存放数据的字体编码;
4)Java的缺省字体编码。
如果在编程中遇到不能正确显示中文时,要先弄清楚以上几项所使用的字体编码,再分析找出原因,即可解决问题。
众所周知,JSP是Java的一种,和网页有关,而网页也有自己的中文编码系统,所以JSP处理中文要比纯Java的类文件更为麻烦。本文的测试数据库是MySQL3.2,数据库连接驱动是用org.gjt.mm.mysql.Driver,这里主要讨论UTF-8和GBK的显示( GB2312是GBK的一个子集,Java中可以使用GBK来代替GB系列)。我们先来研究JSP中字体编码问题, 下面第一到第六点是针对JSP的(因为从数据库里读出中文数据与写入中文数据有所区别,咱们分别说明,前三点是从读取数据库到显示在网页,后三点是从网页输入数据到存入数据库),第七到第九点针对纯Java的类文件。 以下rs表示ResultSet的一个实例,是执行Select语句之后产生的数据集。
一、数据库连接方式使用UTF-8
在连接数据库的驱动后面加上这句参数
useUnicode=true&characterEncoding=UTF-8
例如:
jdbc:mysql://localhost/DBVF?autoReconnect=true&useUnicode=true&characterEncoding=UTF-8
从数据库里读出中文显示在使用GBK的JSP的网页里,如果数据库里存放的字体编码是UTF-8,在JSP中使用
str=new String(rs.getBytes(1),"UTF-8");
或者
str=rs.getString(1);
可以正确显示中文。
如果数据库里存放的是GBK数据,那么JSP中也要使用
str=new String(rs.getBytes(1),"GBK");
来显示正确的中文。
值得注意的是如果页面使用UTF-8,数据库里存放的是UTF-8,也可以用
str=new String(rs.getBytes(1),"GBK");
正确显示中文。
如果网页是UTF-8,而数据库里存放的是GBK,无法直接显示中文,需要2步转换,
str=new String(rs.getBytes(1),"GBK");
再
str=new String(str.getBytes("UTF-8"),"GBK");
才可以正确显示中文。
二、数据库连接方式使用GBK
在连接数据库的驱动后面加上这句参数
useUnicode=true&characterEncoding=GBK
例如:
jdbc:mysql://localhost/DBVF?autoReconnect=true&UseUnicode=true&characterEncoding=GBK
从数据库里读出中文,显示在使用GBK的JSP的网页里.
如果数据库里存放的字体编码是UTF-8,在JSP中一定要使用
str=new String(rs.getBytes(1),"UTF-8");
才正确显示中文。
如果数据库里存放的是GBK数据,那么JSP中也要使用
str=new String(rs.getBytes(1),"GBK");
或者直接使用
str=rs.getString(1);
即可显示正确的中文。
如果网页是UTF-8,而数据库里存放的是GBK,只能用
str=new String(rs.getString(1).getBytes("UTF-8"),"GBK");
的方法来显示中文.
如果网页是UTF-8,而数据库里存放的是UTF-8,可用
str=new String(rs.getBytes(1),"GBK");
或者
rs.getString(1)方法来显示中文。
三、使用缺省数据库连接方式
连接数据库的驱动后面没有这句参数
useUnicode=&characterEncoding=
例如:
jdbc:mysql://localhost/DBName?autoReconnect=true
没有参数
useUnicode=true&characterEncoding,表示使用默认的ISO-8895-1编码。
1. 从数据库里读出中文,显示在GBK的网页里。
如果数据库里存放的字体编码是UTF-8,在JSP网页中一定要使用语句
str=new String(rs.getBytes(1),"UTF-8");
或者
str= new String(rs.getString(1).getBytes("ISO-8859-1"),"UTF-8");
才可正确显示中文。
如果数据库里存放的是GBK数据,那么JSP中也要使用
str=new String(rs.getBytes(1),"GBK");
或
str=new String(rs.getString(1).getBytes("ISO-8859-1"),"GBK");
显示正确的中文。
2. 如果网页是UTF-8,不能直接正确显示GBK,需要2步转换
str=new String(rs.getBytes(1),"GBK");
再
str=new String(str.getBytes("UTF-8"),"GBK");
才可以正确显示中文。
如果数据库里存的是UTF-8,直接用
str=new String(rs.getBytes(1),"GBK");
或者
str=new String(rs.getString(1).getBytes("ISO-8859-1"),"GBK");
就可以显示中文了。
以上是读取数据库里中文正确显示在网页上,下面三点是如何正确存入数据库。
四、数据库连接方式使用UTF-8编码
JSP中要把网页输入的中文存入数据库,通常有一个提交(Submit)的过程,是用
str = request.getParameter("username");
然后执行update或者insert语句来存入数据库。如何赋值给str很重要,而且这里中文输入与网页所使用的字体编码有关。
1、 网页使用UTF-8,使用
str = new String(request.getParameter("username").getBytes("ISO-8859-1"),"UTF-8");
或者
str = new String(request.getParameter("username").getBytes(),"UTF-8");
都可以使得存到数据库里的数据是UTF-8编码。
2. 网页使用GBK,使用
str = new String(request.getParameter("username").getBytes(),"GBK");
那么存入数据库的是UTF-8编码。
3. 值得注意的是使用UTF-8的数据库连接方式不能存得GBK。
五、数据库连接方式使用GBK编码
1. 输入使用GBK网页,存到数据库里是GBK的方法:
str= new String(request.getParameter("username").getBytes("ISO-8859-1"),"GBK");
或者
str= new String(request.getParameter("username").getBytes(),"GBK");
2. 网页使用GBK,想存入UTF-8到数据库里,要分2步:
str=new String(request.getParameter("username").getBytes(),"GBK");
再
str=new String(str.getBytes("UTF-8"),"GBK");
3. 网页使用UTF-8,而且使用
str= new String(request.getParameter("username").getBytes("ISO-8859-1"),"GBK");
或者
str= new String(request.getParameter("username").getBytes(),"UTF-8");
那么存到数据库里的数据是UTF-8编码。
4. 网页使用UTF-8,而且使用
str= new String(request.getParameter("username").getBytes("ISO-8859-1"),"UTF-8");
那么存到数据库里的数据是GBK编码。
六、数据库连接方式使用缺省,即不使用参数useUnicode和characterEncoding
1. 网页使用GBK,如果使用
str= request.getParameter("username");
或者
str= new String(request.getParameter("username").getBytes());
那么在数据库里的数据是GBK码。网页使用UTF-8和使用
str= request.getParameter("username");
则存入数据库是UTF-8编码。
2. 如果使用
str= new String(request.getParameter("username").getBytes("ISO-8859-1"));
那么根据网页提供的字体编码而存到数据库里,比如是UTF-8的网页,那么存到数据库中就是UTF-8编码,如果使用GBK网页,那么存到数据库里的字就是GBK编码。
3. 如果使用
str= new String(request.getParameter("username").getBytes("UTF-8"),"UTF-8");
这一种组合能存到正确的数据外,其他存到数据库里的数据则都是乱码或者错误码。在这个UTF-8组合的特例中,网页使用的是GBK,则存放到数据库里就是GBK,网页使用UTF-8,那么存到数据库里的就是UTF-8。
4. 网页是GBK的要存得UTF-8,一定需要2步:
company=new String(request.getParameter("company").getBytes(),"GBK");
和
company=new String(company.getBytes("UTF-8"))。
5. 网页是UTF-8的,不能存得GBK在数据库里,一句话,改变数据库连接方式不能存得GBK码。
以上所有的都是基于JSP网页和数据库交换数据,下面讨论一下纯JAVA编程下的字体编码转换。
七、数据库连接方式使用UTF-8编码
1. 数据库里的中文是UTF-8,可以转换为GBK,但不能把GBK存入数据库。
2. 数据库是GBK,如果转换为UTF-8,使用
content=new String(rs.getBytes(2),"GBK");
直接将content存入数据库就可为UTF-8。
八、数据库连接方式使用GBK编码
1. 数据库里的中文是UTF-8,如果转换为GBK,使用
content= new String(rs.getString(2).getBytes(),"UTF-8");
再直接使用update或者insert语句插入到数据库,即存得GBK。
如果使用
content= new String(rs.getString(2).getBytes(),"GBK");
或者
content= new String(rs.getString(2).getBytes());
再存入数据库即存得还是UTF-8编码。
2. 数据库里的中文是GBK,如果转换为UTF-8,使用
content= new String(rs.getString(2).getBytes("UTF-8"));
或者
content= new String(rs.getString(2).getBytes("UTF-8"),"GBK");
再直接使用update或者insert语句插入到数据库,即存得UTF-8。
3. 如果某个String是GBK,要转换为UTF-8,也是使用
content= new String(GBKstr.getBytes("UTF-8"));
或者
content= new String(GBKstr.getBytes("UTF-8"),"GBK");
如果某个String是UTF-8,要转换为GBK,应该使用new String(UTFstr.getBytes("GBK"),"UTF-8")。
九、数据库连接方式使用缺省,即不跟参数
1. str2=new String(GBKstr.getBytes("UTF-8"),"ISO-8859-1");
可以将数据库里的GBK编码转换为UTF-8。
2. 读取UTF-8然后存入UTF-8,则用
str1=new String(UTFstr.getBytes(),"ISO-8859-1");
或者
str1=new String(UTFstr.getBytes("GBK"),"ISO-8859-1");
3. 不能实现数据库里的UTF-8转换为GBK。
如果采用UTF-8的数据库连接方式或者缺省数据连接方式,那么无法将UTF-8转为GBK;而GBK的数据库连接方式可以实现UTF-8和GBK的相互转换。建议大家采用GBK的数据连接方式。
发表评论
-
eclipse快捷键
2009-02-03 09:17 960作用域 功能 快捷键 全局 查找并替换 Ctrl+F 文本 ... -
Java随机码
2009-01-21 10:26 1567package servlet; import java.a ... -
java时间
2009-01-21 10:24 10401. package com.hefeng.test ... -
fastExcel
2009-01-21 10:22 11561. public void testFastExcel ... -
类到底是从哪个Jar包或者目录下装载的
2009-01-11 09:54 909aClass.getProtectionDomain().ge ... -
生成可执行jar文件的教程
2008-12-11 09:27 990若要生成一个名为 cal.jar 的可执行jar文件:(文件名 ... -
软件智力面试题及答案
2008-08-28 11:29 1139第一组 1.烧一根不均匀的绳,从头烧到尾总共需要1个小时。 ... -
word,excel,pdf
2008-08-28 09:59 9781、一个jacob操作Word的例子,其他操作excel,pd ... -
prototype.js参考
2008-08-22 16:42 1226<!DOCTYPE HTML PUBLIC " ... -
各类Http请求状态(status)及其含义
2008-08-22 16:18 1042AJAX中请求远端文件、或在检测远端文件是否掉链时,都需要了解 ... -
Eclips反编译插件的安装
2008-06-26 09:23 1193大家也许用过其他的反编译工具,比如jad,或者是集成的DJ J ... -
Java反射学习
2008-03-14 10:09 1914Java反射学习 Java反射学 ... -
java性能小知识
2008-02-28 09:47 895Vector v=new Vector(); for(int ... -
qq,msn,skype即时消息
2008-02-19 16:13 1081详细信息请见附件 -
java union and intersection
2008-01-18 09:50 2692String[] arrayA = new String[] ... -
Javamail
2008-01-10 13:20 2338Javamail,论坛上由已经有很多的讨论,但是俺觉得还是不够 ... -
cvs搭建过程
2007-09-26 11:05 1093一。附件是安装文件 二。建资源库,可在任何地方。 三。set ... -
代码控制来改变应用程序的当前工作目录
2007-09-03 09:34 1025System.setProperty("user.d ... -
java file or folder
2007-08-28 13:21 1441import java.io.*; public class ... -
java调用存储过程
2007-08-20 09:12 673DBOperator db = new DBOperator( ...
相关推荐
java如何正确使用字体编码java如何正确java如何正确使用字体编码使用字体编码java如何正确使用字体编码
2 网页中使用的字体编码; 3 数据库里存放数据的字体编码; 4 Java的缺省字体编码 如果在编程中遇到不能正确显示中文时 要先弄清楚以上几项所使用的字体编码 再分析找出原因 即可解决问题 ">ava支持UTF 8 ISO 8859 1 ...
它的类库很小,只有500K左右,利用该类库判定文本文件的代码如下(由于cpdetector的算法使用概率统计,所以结果并不是100%准确的,但是是迄今为止我见过
本文介绍了字符与编码的发展过程,相关概念的正确理解。举例说明了一些实际应用中,编码的实现方法。然后,本文讲述了通常对字符与编码的几种误解,由于这些误解而导致乱码产生的原因,以及消除乱码的办法。本文的...
java端:返回类型非字符接口调用StringUtils#base64AndCompressJson进行编码压缩 ,返回类型为字符接口调用StringUtils#base64Andcompress js 端:引入压缩包中的js文件 ,调用deBase64AndUncompress进行解压解码
Java文本字符编码解码操作类 Escape.java源代码 说明:本方法保证 不论参数s是否经过escape()编码,均能得到正确的“解码”结果。
在java应用软件中,会有多处涉及到字符集编码,有些地方需要进行正确的设置,有些地方需要进行一定程度的处理。本文主要给大家讲解java中字符的编码格式等相关问题
日常开发中我们会遇到使用字符串ID,最先行到的就是UUID生成我们的随机字符串,但是UUID也是会出现重复的几率的!所以我们引入的新的ULID ULID的特性 与UUID的128位兼容性 每毫秒1.21e + 24个唯一ULID 按字典顺序...
程序可以自动检测文本文件的编码类型,并用记事本以正确的编码类型打开,基本结局了windows记事本因编码类型错误引起的乱码情况。 使用方式cmd下 chartype /?查看命令行使用方式。 鼠标右键快捷方式直接打开。 文件...
Java非对称加密源程序代码实例,本例中使用RSA加密技术,定义加密算法可用 DES,DESede,Blowfish等。 设定字符串为“张三,你好,我是李四” 产生张三的密钥对(keyPairZhang) 张三生成公钥(publicKeyZhang...
Java非对称加密源程序代码实例,本例中使用RSA加密技术,定义加密算法可用 DES,DESede,Blowfish等。 设定字符串为“张三,你好,我是李四” 产生张三的密钥对(keyPairZhang) 张三生成公钥(publicKeyZhang...
WARTS是一个纯Java数据库工具,可以执行字符编码识别的数据同步。开发它是用于在UTF-8 Oracle实例中使用ASCII编码的Oracle 数据库中来正确的传输非ASCII字符。 Java模板语言 Beetl Beetl,是Bee Template Language的...
3.文件编码的自动设别方法与测试示例(自动列出编码、最可能的编码、有多种编码可能的情况下打印用各种编码解码出来的内容以便核对,下载文件中附带乱码的文件例子和正确的读取方法)。 声明: 除了“文件编码的...
8.1.2 在Eclipse中使用包 194 8.1.3 天上掉下个package 197 8.1.4 包带来了什么? 197 8.2 import语句:化繁为简 200 8.2.1 import语句 200 8.2.2 一网打尽包中所有类 201 8.2.3 import语句带来的小问题 202 ...
WARTS是一个纯Java数据库工具,可以执行字符编码识别的数据同步。开发它是用于在UTF-8 Oracle实例中使用ASCII编码的Oracle 数据库中来正确的传输非ASCII字符。 Java模板语言 Beetl Beetl,是Bee Template Language的...
WARTS是一个纯Java数据库工具,可以执行字符编码识别的数据同步。开发它是用于在UTF-8 Oracle实例中使用ASCII编码的Oracle 数据库中来正确的传输非ASCII字符。 Java模板语言 Beetl Beetl,是Bee Template Language的...
WARTS是一个纯Java数据库工具,可以执行字符编码识别的数据同步。开发它是用于在UTF-8 Oracle实例中使用ASCII编码的Oracle 数据库中来正确的传输非ASCII字符。 Java模板语言 Beetl Beetl,是Bee Template Language的...
WARTS是一个纯Java数据库工具,可以执行字符编码识别的数据同步。开发它是用于在UTF-8 Oracle实例中使用ASCII编码的Oracle 数据库中来正确的传输非ASCII字符。 Java模板语言 Beetl Beetl,是Bee Template Language的...
WARTS是一个纯Java数据库工具,可以执行字符编码识别的数据同步。开发它是用于在UTF-8 Oracle实例中使用ASCII编码的Oracle 数据库中来正确的传输非ASCII字符。 Java模板语言 Beetl Beetl,是Bee Template Language的...