`
xuxiaolei
  • 浏览: 148801 次
  • 性别: Icon_minigender_1
  • 来自: 彩虹之巅
社区版块
存档分类

彻底解决超链接提交中文乱码问题

阅读更多

在网页中的超链接,例如 <a href="/servlet?id=1&name=世界">click me</a>,如果超链接里的地址有中文就如上面的'name=世界'一样,即使在web.xml中设置转换字符集的filter,在servlet中得到的值还是乱码。下面是我的几个实验,

(1) 首先,在web.xml中没有字符集转换的filter下,在表单中提交中文的情况,HTML片段如下

<form action="./servlet/MyServlet" method="get">
    	<input type="text" name="name">
    	<input type="submit">
</form>

在文本框中输入'世界', 毫无疑问这个时候在servlet中得到的name的值是乱码 例如:name = ????

(2)现在再把form中的method方法换成post并且仍然是在web.xml中没有字符集转换的filter下,看在表单中提交中文会不会有乱码,HTML片段如下

<form action="./servlet/MyServlet" method="post">
    	<input type="text" name="name">
    	<input type="submit">
</form>

 在文本框中输入'世界', 这个时候在servlet中得到的name的值仍然是乱码 例如:name = ????

(3)现在在web.xml中加入字符集转换的filter,代码如下

<filter>
        <filter-name>Set Character Encoding</filter-name>
        <filter-class>filters.SetCharacterEncodingFilter</filter-class>
        <init-param>
            <param-name>encoding</param-name>
            <param-value>GBK</param-value>
        </init-param>
    </filter>
    
    <filter-mapping>
        <filter-name>Set Character Encoding</filter-name>
        <url-pattern>/*</url-pattern>
    </filter-mapping>

(4)现在咱们还是现在form的method属性是get时候进行测试,在文本框中输入世界,然后在servlet中得到的name值仍然是乱码,name = ????

(5)然后再在form的method属性是post时候进行测试,在文本框中输入世界,然后在servlet中得到的name值就是正常的值的没有乱码。

我现在用的浏览器是IE,就是表单提交中文时候,如果正确的设置了字符集转换的filter,那么在form中的post方法中提交时,在servlet中得到的正常的值,如果在form中的get方法中提交时候,得到的中文数据居然是乱码,这个有点不可思议。

(6)然后在同样的环境下,在超链接的href属性中提交中文参数值,例如

<a href='./servlet/MyServlet?name=世界>click me</a> <br>

 在servlet中得到的是乱码。在这种情况下在servlet中进行转码。例如,

try {
     name = new String(name.getBytes("ISO-8859-1"), "gbk");
} catch(Exception e) {
     e.printStackTrace();
}

 或者

java.net.URLDecoder.decode(name) 通过这个语句进行转码也是可以得到正常值的。

(7)同样是在有字符集转换的filter下,在JSP中使用JSTL的 <c:url>标签是否可以避免乱码吗,使用如下的标签

<c:url value="./servlet/MyServlet" var="url">
    	<c:param name="name" value="${'世界'}" />
</c:url>
    
<a href="${url}">Hello</a> <br>

 然后在servlet中得到的仍然是乱码,仍然需要(6)中介绍的方法进行转换,才能得到正确的值。

(8)通过post方法提交的表单中的中文值是不需要通过(6)中的进行转码的,如果进行转码的话,反而会造成乱码。那么,在serlvet中,如果让这两种提交方式(超链接提交和表单post方法)都通用的话,如果超链接的值没有中文的话是可以实现通用的,如果超链接提交的参数有中文的话,就会出现问题,那么就必须在超链接提交的URL中另加一个额外的参数来标识是从哪里提交的,以此来决定是否需要对特定的值进行转化。有没有更好的办法在超链接里提交中文时候在servlet中不进行转码呢。答案就是(5)。如果把超链接提交转化为表单的post提交,中文就不会出现乱码,见(9)

(9)

function linkClick(linkObject) {
			
    var formObject = document.createElement('form');
    document.body.appendChild(formObject);
     formObject.setAttribute('method', 'post');
     var url = linkObject.href;
     var uri = '';
     var i = url.indexOf('?');
			
     if(i == -1) {
        formObject.action = url;
     } else {
        formObject.action = url.substring(0, i);
     }
			
     if( i >= 0 && url.length >= i + 1) {
        uri = url.substring(i + 1, url.length);
     }

     var sa = uri.split('&');
			
     for(var i = 0; i < sa.length; i++) {
       var isa = sa[i].split('=');		
       var inputObject = document.createElement('input');
       inputObject.setAttribute('type', 'hidden');
       inputObject.setAttribute('name', isa[0]);
       inputObject.setAttribute('value', isa[1]);
       formObject.appendChild(inputObject);
     }
			
     formObject.submit();
			
     return false;
}

 下面是html代码

 

<a href='./servlet/MyServlet?name=世界&id=1' onclick="return linkClick(this)">click me</a> <br>

 这样就OK了,在linkClick方法里面会自己创建一个表单,然后会去解析你的参数并自动转化成hidden,并给hidden域赋值,这样,再也不怕提交中文参数,并且也不需要在servlet中进行麻烦的转码,真是一劳永逸啊,但是需要在JSP的超链接中加上上面的方法。上面的程序用的是IE6和tomcat5。

7
6
分享到:
评论
7 楼 dying 2012-05-03  
扯淡,你连pageEncoding和contentType都没有设置
6 楼 l_c12991 2009-12-29  
第七种情况下, 传入的中文字数为奇数,获取的最后一个汉字乱码,怎么回事?请问一下
5 楼 xuxiaolei 2008-04-29  
<Connector port="8080" maxHttpHeaderSize="8192"
  maxThreads="150" minSpareThreads="25" maxSpareThreads="75"
  enableLookups="false" redirectPort="8443" acceptCount="100"
  connectionTimeout="20000" disableUploadTimeout="true" URIEncoding="GBK" />

今天看到javaeye论坛上一篇好文,介绍为什么post提交中文不乱码而get提交中文会乱码,原来,get提交后是不会经过filter过滤的。如果要get提交中文不乱满,就在server.xml文件中Connector节点加上 URIEncoding="GBK",默认的如果没有URIEncoding的话,会使用ISO-8859-1的字符集的。还有一个方法是:tomcat的connector元素中另外提供了useBodyEncodingForURI参数,其值为boolean型,true代表使用处理body的encoding方法(即request.setCharacterEncoding)来处理URI的编码,这样就可以用一个过滤器来同时处理post和get方法了。
具体详见论坛帖子:
http://www.iteye.com/topic/187949
今天又长见识了
4 楼 lubang168 2008-04-28  
过滤器是不处理get 方法的.而用超链结默认就是get 提交的.
所以通过get方法提交含有中文字符的数据要手动进行转换.
可以写一个公用方法直接调用就可以了.例如:
public static String toChinese(String str){
if(str!=null){
try {
str=new String(str.getBytes("ISO-8859-1"),"GBK");
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}

}
return str;
}

3 楼 jiyanliang 2008-04-28  
Encode的时候加上统一编码就不会出现乱码了
2 楼 xuxiaolei 2008-04-26  
to ferreousbox:
就算在JSP页面中对超链结中提交的中文encode还会出现乱码:
例如:
<a href='./servlet/MyServlet?name=<%=java.net.URLEncoder.encode("世界") %>'>click me</a> <br>

然后在servlet中得到的结果是 name = ????,还是会乱码,要想变成正常值必须通过java.net.URLDecoder.decode(name) 在转回来才会是中文的正常的值
1 楼 ferreousbox 2008-04-26  
你这样岂不是很麻烦?何必不encode一下中文呢?

相关推荐

Global site tag (gtag.js) - Google Analytics