- 浏览: 495773 次
- 性别:
- 来自: 广州
文章分类
- 全部博客 (285)
- 数据库 (49)
- dwr (1)
- js (35)
- security (6)
- freemaker (4)
- 网站建设 (15)
- css (5)
- javaEE (56)
- 生活点滴 (12)
- 安装与配置 (16)
- ssh2 (13)
- 开源软件 (6)
- web 应用服务器 (6)
- 开发模式和设计模式 (2)
- linux (5)
- 项目管理 (7)
- 计算机杂症 (0)
- appScan (1)
- idea (3)
- android (1)
- java @override 报错处理 (1)
- lucene (5)
- java (2)
- groovy (1)
- Extjs (7)
- asp (2)
- php (2)
- Memcached (1)
- 名言 (1)
- 面试 (1)
- Jmeter (0)
- 微信支付 (1)
- app开发 (1)
- branch分支合并到trunk主干 (1)
- 自动化测试 (1)
- springClond (1)
- ELK (2)
最新评论
-
skykufo:
坑爹啊,我也因为写多了一个div,在ie8浪费了一天
jQuery加载(load、get、post)页面显示空白原因 -
yeyinzhu3211:
帅哥,我想问下,是怎么去除呀?能详细说明下吗?
IntelliJ IDEA 10.5.1 无法断点或停止不动 -
sshitaime:
怎么下载不了啊,能给我一个安装包吗
oracle 10g透明网关组件下载地址(新) -
fuanyu:
xiaohuafyle 写道被你的头像吓尿了 哥们有这么可怕呀 ...
netstat -aon -
wanlt_software:
谢谢。。。。。
oracle 10g透明网关组件下载地址(新)
我写这个不是讲解中英文之间的差距,解码等,我是将我在这几年工作遇到各种各样的乱码的解决方法,总结起来,也希望大家能把自己晕倒解决乱码的方法都说出来,咱们弄一个解决乱码的“葵花宝典”。
对于Java,由于默认的编码方式是UNICODE,所以用中文也易出问题,常见的解决是:
String s2 = new String(s1.getBytes(“ISO-8859-1”),”GBK”); |
1、utf8解决JSP中文乱码问题
一般说来在每个页面的开始处,加入:
|
◆charset=UTF-8的作用是指定JSP向客户端输出的编码方式为“UTF-8”;
◆pageEncoding="UTF-8",为了让JSP引擎能正确地解码含有中文字符的JSP页面,这在LINUX中很有效;
◆request.setCharacterEncoding("UTF-8");是对请求进行了中文编码。
有时,这样仍不能解决问题,还需要这样处理一下:
|
2、Tomcat 5.5中文乱码
只要把%TOMCAT安装目录%/ webapps\servlets-examples\WEB-INF\classes\filters\SetCharacterEncodingFilter.class文件拷到你的webapp目录/filters下,如果没有filters目录,就创建一个。
2)在你的web.xml里加入如下几行:
<filter> <filter-name>Set Character Encoding</filter-name> <filter-class>filters.SetCharacterEncodingFilter</filter-class> <init-param> <param-name>encoding</param-name> <param-value>GBK</param-value> </init-param> </filter> <filter-mapping> <filter-name>Set Character Encoding</filter-name> <url-pattern>/*</url-pattern> </filter-mapping> |
3)完成
2、get方式的解决办法
1)打开tomcat的server.xml文件,找到区块,加入如下一行:
URIEncoding=”GBK” |
完整的应如下:
port="80" maxThreads="150" minSpareThreads="25" maxSpareThreads="75" enableLookups="false" redirectPort="8443" acceptCount="100" debug="0" connectionTimeout="20000" disableUploadTimeout="true" URIEncoding="GBK" /> |
2)重启tomcat,一切OK。
3、xmlHttpRequest中文问题
页面jsp用的GBK编码
代码:
<%@ page contentType="text/html; charset=GBK"%> |
代码:
function addFracasReport() { var url="controler?actionId=0_06_03_01&actionFlag=0010"; var urlmsg="&reportId="+fracasReport1.textReportId.value; //故障报告表编号 var xmlHttp=Common.createXMLHttpRequest(); xmlHttp.onreadystatechange = Common.getReadyStateHandler(xmlHttp,eval("turnAnalyPage")); xmlHttp.open("POST",url,true); xmlHttp.setRequestHeader( " Content-Type " , "application/x-www-form-urlencoded); xmlHttp.send(urlmsg); } |
#p#
后台java中获得的reportId是乱码,不知道该怎么转,主要是不知道xmlHttp.send(urlmsg);以后是什么编码?在后面用java来转,试了几种,都没有成功,其中有:
代码:
public static String UTF_8ToGBK(String str) { try { return new String(str.getBytes("UTF-8"), "GBK"); } catch (Exception ex) { return null; } } public static String UTF8ToGBK(String str) { try { return new String(str.getBytes("UTF-16BE"), "GBK"); } catch (Exception ex) { return null; } } public static String GBK(String str) { try { return new String(str.getBytes("GBK"),"GBK"); } catch (Exception ex) { return null; } } public static String getStr(String str) { try { String temp_p = str; String temp = new String(temp_p.getBytes("ISO8859_1"), "GBK"); temp = sqlStrchop(temp); return temp; } catch (Exception e) { return null; } } |
4、JDBC ODBC Bridge的Bug及其解决方法
在编写一数据库管理程序时,发现JDBC-ODBC Bridge存在不易发现的Bug。在向数据表插入数据时,如果为英文字符,存储内容完全正确,如果存入中文字符,部分数据库只能存储前七八个中文字符,其他内容被截去,导致存储内容的不完整(有些数据库不存在这个问题,如Sybase SQL Anywhere 5.0。JDBC-ODBC Bridge还存在无法建表的Bug)。
对于广大需要存储中文信息的Java程序员来说,这可是一个不好的消息。要么改用其他语言编程,要么选择其他价格昂贵的数据库产品。“一次编写,到处运行”的目标,也大打折扣。能不能采用变通的方法,将中文信息进行处理后再存储来解决这个问题呢?答案是肯定的。
解决问题的具体思路、方法
Java采用Unicode码编码方式,中英文字符均采用16bit存储。既然存储英文信息是正确的,根据一定规则,将中文信息转换成英文信息后存储,自然不会出现截尾现象。读取信息时再进行逆向操作,将英文信息还原成中文信息即可。由GB2312编码规则可知,汉字一般为二个高位为1的ASCII码,在转换时将一个汉字的二个高位1去掉,还原时再将二个高位1加上。为了处理含有英文字符的中文字串,对英文字符则需要加上一个Byte 0标记。以下提供的两个公用静态方法,可加入任何一个类中使用。
将中英文字串转换成纯英文字串
public static String toTureAsciiStr(String str){ StringBuffer sb = new StringBuffer(); byte[] bt = str.getBytes(); for(int i =0 ;i〈bt.length;i++){ if(bt[i]〈0){ //是汉字去高位1 sb.append((char)(bt[i]&&0x7f)); }else{//是英文字符 补0作记录 sb.append((char)0); sb.append((char)bt[i]); } } return sb.toString(); } |
将经转换的字串还原
|
上例在实际编程中效果很好,只是存储的中文信息需要经过同样处理,才能被其他系统使用。而且如果中文字串出现英文字符,实际上增加了额外的存储空间。
#p#
5、Solaris下Servlet编程的中文问题及解决办法
在使用Java开发Internet上的一个应用系统时,发现在Windows下调试完全正常的Servlet,上传到Solaris服务器上,运行却出现故障——返回的网页不能显示中文,应为中文的信息全为乱码;用中文信息做关键字,不能正确检索数据库。后来采用加入检查代码等方法探知故障原因如下:
显示乱码主要是因为通过类HttpServletResponse提供的方法setContentType无法改变返回给客户的数据的编码方式,正确的编码方式应为GB2312或者GBK,而事实上为缺省的ISO8859-1。无法检索中文信息则是因为,客户提交的中文信息经浏览器编码到达服务器后,Servlet无法将其正确解码。
举例说明显示乱码解决方法
Servlet一般通常做法如下:
public class ZldTestServlet extends HttpServlet { public void doGet (HttpServletRequest request,HttpServletResponse response)throws ServletException,IOException{ //在使用 Writer向浏览器返回数据前,设置 content-type header,在这里设置相应的字符集gb2312 response.setContentType("text/html;charset=gb2312"); PrintWriter out = response.getWriter(); //* // 正式返回数据 out.println("〈html〉〈head〉〈title〉Servlet test〈/title〉〈/head〉" ); out.println("这是一个测试页!"); out.println("〈/body〉〈/html〉"); out.close(); } ... } |
解决页面显示乱码问题,需将*处代码换成如下内容:
PrintWriter out = new PrintWriter(new OutputStreamWriter(response.getOutputStream(),"gb2312")); |
Solaris中文信息检索问题的解决
浏览器利用表单向服务器提交信息时,一般采用x-www-form-urlencoded 的MIME格式对数据进行编码。如果使用get方法,参数名称和参数值经编码后附加在URL后,在Java中称作查询串(query string)。
在Servlet程序中,如果采用ServletRequest的方法getParameter取得参数值,在Solaris环境下,对汉字却不能正确解码。因而无法正确检索数据库。
在Java 1.2的包——java.net中提供了URLEncode和URLDecode类。类URLEncode提供了按x-www-form-urlencoded格式对给定串进行转换的方法。类URLEncode则提供了逆方法。
6、Common Mail乱码问题
common mail是一个小而方便的mail包,他实现了对Java Mail的封装,使用起来十分的方便,但是我在使用他的时候发现,使用纯文本的内容发送,结果是乱码,代码如下:
public class TestCommonMail { public static void main(String[] args) throws EmailException, MessagingException { SimpleEmail email = new SimpleEmail(); email.setCharset("GB2312"); email.setHostName("smtp.163.com"); email.setSubject("test"); email.addTo("test@163.com"); email.setFrom("test@163.com"); email.setMsg("我的测试"); email.setAuthentication("test", "test"); email.send(); } } |
分析了一下commons mail的源码找到了原因。源码如下:
|
Email代码片段:
|
由代码可以知道纯文本方式最终调用了Java Mail的message.setContent(this.content, this.contentType);content是内容,contentType是类型,如text/plain,(我们可以试试直接用Java mail发邮件,设置文本内容不使用setText方法,也使用setContent("测试", "text/plain")方式,你可以看到内容也是乱码)。关键就在于text/plain,我们改成text/plain;charset=gb2312,ok乱码解决了。在commons mail我们看SimpleEmail类中setMsg方法调用的就是setContent(msg, TEXT_PLAIN);我们只需要将Email类中的常量TEXT_PLAIN修改一下加入charset=你的字符集,重新打包jar,这样就可以了。
#p#
7、toad的字符集的设置与oracle的安装
oracle数据库服务器的安装一般是中文字符集,有时安装在不同的平台下,设置为ISO编码,toad是oracle开发的最好工具,不是我说的,可是中文环境下安装的toad,打开英文字符的oracle时,中文全是乱码。必须进行设置:
环境变量---〉系统变量
加
NLS_lANG=SIMPLIFIED CHINESE_CHINA.ZHS16GBK
或
NLS_lANG=AMERICAN_AMERICA.WE8ISO8859P1
AMERICAN_AMERICA.WE8MSWIN1252
或者
(1)打开注册表,点击HKEY_LOCAL_MATHINE;
(2)再点击Software,再点击ORACLE;
(3)在点击HOME(ORACLE所在目录);
(4)在注册表的右半面有NLS_LANG;
(5)双击它,将你想要的覆盖掉原来的,就可以了;
(6)最好记下旧的,以便可以改回来。
connect sys/chang_on_install update props$ set value$='ZHS16CGB231280' where name='NLS_CHARACTERSET'; commit; |
这样就OK了。
8、如何解決GWT(google web toolkit)中文的问题
GWT中文乱码解决方法
(1)把你要显示的中文“测试字符串”输入到一个文件,如:1.txt;
(2)进入命令行,进入1.txt所在的目录,敲入以下命令:native2ascii.exe 1.txt 2.txt回车。这样就生成了另外一个文件2.txt;
(3)2.txt的内容如下:\u6d4b\u8bd5\u5b57\u7b26\u4e32;
(4)然后用上面的编码,在gwt中使用,就可以了。
9、xmlHttp得到的网页怎么是乱码?
(1)在服务器端使用WebRequest而不是xmlHttp
(2) 将
|
对于简体中文改成:
|
对于utf-8改成:
|
当然,Encoding枚举还有很多其他的成员,对于不同的编码content-type可以有选择的应用。
(3)后来我发现无论是content-type是gb2312还是utf-8,用
StreamReader sr = new StreamReader(stream , Encoding.Default ); |
都可以返回正常的汉字,所以统一的改成Encoding.Default。
最后,在服务器端从一个url获得网页的源代码的代码如下:
|
原文:http://www.51cto.com/specbook/11/53612.htm
发表评论
-
java 模拟微信浏览器http请求
2020-12-16 08:49 724public static void main(St ... -
java 小数点处理的问题
2015-08-22 16:23 749float num= (float)1/100 ... -
java操作excel 替换指定字符串
2014-12-26 10:27 5220根据excel模板里设置指定的num0,num1,num2 ... -
itext对水印图片的旋转、放大、缩小等操作的示例
2014-07-24 17:17 5734package test1; import java. ... -
java 获取ip
2014-04-25 16:38 831public static String getIpAddr ... -
读取poi
2014-03-12 17:57 1306/** * Writer: fuanyu * Dat ... -
对Map排序
2014-02-20 15:38 760本来来自:http://blog.sina.com.cn/s ... -
java 上下篇文章实现的思路
2014-02-14 15:03 755当前文章的ID =request("id" ... -
Java:String和Date、Timestamp之间的转换
2013-12-03 14:39 10221.1 String -> Date String ... -
ArrayList和数组间的相互转换
2012-07-31 16:00 1084package test.test1; import ... -
No result defined for action and result
2012-07-02 11:50 976当你在用struts2开发时,如果,从页面跳入action时, ... -
IntelliJ IDEA 10.0 使用javac 编译程序出现“非法字符: \65279 ”解决方法
2012-04-26 11:42 2145一、问题描述: 将在eclipse 创建的项目代码导入 I ... -
map取key及key的值
2012-03-19 15:53 1604public class Test2 { p ... -
用jdbc操作CLOB型数据的两种方式
2012-02-08 10:29 1278最近学Oracle,正好单位OA中Word文件是将文件用BAS ... -
java @override 报错处理
2012-02-02 14:14 1317有时候在自己电脑上编译通过的java代码,在别人那里确编译 ... -
Java判断字符串中是否包含汉字
2011-12-15 11:54 2258有两个方法 import java.util.regex.M ... -
JMagick+ImageMagic处理图片(高质量)
2011-11-27 13:37 2662项目需要简单处理一些用户上传的图片,如缩略图、剪切、旋转、水印 ... -
定时发送邮件的思路
2011-11-19 12:11 1270定时发送邮件:大概是用户选择在某个时间发送邮件; 步骤: ... -
java 解析json
2011-11-10 17:00 1100如下面代码 String str="[{'bus ... -
javamail 收邮件遇到的问题及解决方法
2011-11-04 16:29 22681.java.io.UnsupportedEncodingEx ...
相关推荐
java中文乱码问题详解--- java中文乱码问题详
主要介绍了Java避免UTF-8的csv文件打开中文出现乱码的方法,结合实例形式分析了java操作csv文件时使用utf-16le编码与utf8编码相关操作技巧,需要的朋友可以参考下
java中最头疼的可能就是中文乱码的问题,这个可以彻底解决中文乱码的问题
非常不错的资料,自己总结的东西,希望有帮助
经常在读取数据库或者JSP的时候出现乱码,可能很难猜测乱码是什么编码格式的。把乱码贴到这个程序中点解码,程序会用所有选中的字符集对乱码解码,再重新编码。最终得到一些内容,并显示解开乱码的方案。
基于javadbf-0.4.0而修改的,导入dbf文件时标题转码采用系统默认编码处改为采用用户自定义的转码格式,从而解决标题乱码的问题
ava中有个比较重要的类Properties(Java.util.Properties),主要用于读取Java的配置文件,各种语言都有自己所支持的配置文件,配置文件中很多变量是经常改变的,这样做也是为了方便用户,让用户能够脱离程序本身去...
java 解析csv文件例子,csv文件 中文乱码问题
彻底解决JAVA读取写入 TXT中文乱码问题 源码
主要介绍了Java Http请求传json数据乱码问题的解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
本Demo主要针对jquery的$.getJSON操作,返回json, 针对传参出现的中文乱码, json里出现中文乱码。
jar包里面包含了:hapi解析HL7的代码范例,所需jar包。亲测可用。《Java版本》
java解析DXF文件信息,这里涉及到各种转换字符串编码的操作,解决了解析过程中遇到中文的乱码问题,包括circle,ellipse,line,lwpolyline等,还涉及到从DXF文件中读取一个字符串、判断CIRCLE实体、判断ellipse实体、...
NDK开发之C语言调用Java构造方法、父类方法、返回中文字符串乱码问题案例详细解析。
java——图片字体显示方块问题处理 /usr/java/jdk1.7.0_80/jre/lib/fonts/fallback msyhbd.ttf msyh.ttf wqy-microhei.ttf /usr/java/jdk1.7.0_80/lib/fonts/fallback msyhbd.ttf msyh.ttf wqy-microhei.ttf
本文深入分析了Java程序设计中Java编译器对java源文件和JVM对class类文件的编码/解码过程,通过此过程的解析透视出了Java编程中中文问题产生的根本原因,最后给出了建议的最优化的解决Java中文问题的方法。
java 压缩和解压 demo 解决中文乱码 这是本人做好的一个关于java压缩、解压缩文件或文件夹的demo,解决了中文乱码的问题,可以压缩或解压缩嵌套文件夹。一个ZipHelper + ant.jar轻松解决^_^,希望可以帮助到大家!具体...
读取zip文件,不解压缩直接解析,支持文件名中文,解决内容乱码(还是以支付宝对账单为例)