`
txxg
  • 浏览: 19508 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

Tomcat的中文處理

    博客分类:
  • Old
阅读更多

原地址

httpwww.csdn.netdeveloparticle1717204.shtm

httpwww.csdn.netdeveloparticle1717222.shtm

httpwww.csdn.netdeveloparticle1717223.shtm

httpwww.csdn.netdeveloparticle1717225.shtm

httpwww.csdn.netdeveloparticle1717233.shtm

作者:ggyy1977@hotmail.com


Tomcat的中文处理(一)

看到很多朋友问关于中文的处理问题,下面我们以tomcat4.0为servlet,jsp引擎来说说unicode的处理。

1)       从客户端接受请求

当客户端请求tomcat的一个jsp文档的时候,tomcat会构造相应的httpServletRequest实现类的实例来代表客户端,通过对流servletInputStream读,我们可以得到客户端来的数据。

   在jsp中我们通常使用的request.getParameter()来得到参数的值,这个函数的背后到底怎么样的呢?怎么样对String编码的呢?

  通过tomcat的httpServletRequest实现类源代码考察:

  

public String getParameter(String name)

    
...{

        parseParameters();处理parameters

        String values[] 
= (String[])parameters.get(name);//得到该参数名字对应的Object(是一个数组)

        
if(values != null)

        
...{

            
return values[0];

        }
 else

        
...{

            
return null;

        }


    }


 

其中parameters是request的一个map类型的数据成员,用来存放接受到的客户端的数据。也就是说每当客户端请求的时候,tomcat构造一个request实例,该实例有一个parameters用来存放从servlet实例的写入流的读来的客户端的数据。

  从上面的代码知道最重要的的是parseParameters()函数,它是来处理parameters的。

下面来看看:

protected void parseParameters()

    
...{

        
if(parsed)

        
...{

            
return;//如果处理过了,就不要处理了

        }


        ParameterMap results 
= parameters;//构造parameters对象的本地引用

        
if(results == null)

        
...{

            results 
= new ParameterMap();//如果没有实例

        }


  results.setLocked(
false);

        String encoding 
= getCharacterEncoding();//得到httpServeltRequest的编码

        
if(encoding == null)

        
...{

            encoding 
= ISO-8859-1;//如果没有指定httpServeltRequest的编码采用ISO-8859-1

        }


       。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

            RequestUtil.parseParameters(results, queryString, encoding);
//处理编码

。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

                              

                is.read(buf, len, max 
- len); 从流中读取数据

           。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

                RequestUtil.parseParameters(results, buf, encoding);处理编码

         。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

        parameters 
= results;重置引用

    }


下面再来看看RequestUtil.parseParameters(results, buf, encoding);的处理:

在此就不贴源代码了,

RequestUtil.parseParameters(results, buf, encoding)的处理中对于buf  byte数组进行处理,构造key和value,就是参数名字和参数值:

 

 

while(ix  data.length) 

            
...{

                
byte c = data[ix++];

                
switch((char)c)

                
...{

                
case 38  '&'

                    value 
= new String(data, 0, ox, encoding);

                    
if(key != null)

                    
...{

                        putMapEntry(map, key, value);

                        key 
= null;

                    }


                    ox 
= 0;

                    
break;

 

                
case 61  '='

    key 
= new String(data, 0, ox, encoding);

                    ox 
= 0;

                    
break;

 

                
case 43  '+'

                    data[ox
++= 32;

                    
break;

 

                
case 37  '%'

                    data[ox
++= (byte)((convertHexDigit(data[ix++])  4+ convertHexDigit(data[ix++]));

                    
break;

 

                
default

                    data[ox
++= c;

                    
break;

                }


            }


            
if(key != null)

            
...{

                value 
= new String(data, 0, ox, encoding);

                putMapEntry(map, key, value);

            }

 

 

显然对于参数名字和参数的值都是采用的new String(data, 0, ox, encoding);方法来使用指定的编码方式构造的。

结论:我们不难看出如果没有指定request的编码方式,那么从客户端接受到的参数的名字和参数值都是以iso-8859-1编码的String的。

   也就是说我们在jsp的页面中的表单元素中给出的参数值在通过request.getParamter()得到后的String是以iso-8859-1编码的。

 

而且我们看看tomcat为jsp产生的java文件知道,对于在jsp定义的没有指定编码方式的String的时候,tomcat是使用的iso-8859-1方式的,而不是系统默认的。

  比如:

%

String name=new String(“你好”);或者String name=”你好”;都是使用的iso-8859-1的编码方式的。

System.out.println(name);就会产生乱码的。(因为Console使用的系统的默认编码的,中文系统是gb2321,日文是MS932).

%

下篇我们介绍httpServletResponse的处理

  

Tomcat的中文處理(二):

 

上篇我们介绍了tomcat是怎么对接收到字符进行编码的,现在我们来看当向客户端写html文档的时候到底发生了什么?

 

tomcate在向客户端写出数据的時候,使用的是response的输出流來实现的。但是jsp是怎樣使用response的流的呢?

在使用JSP内含對象out輸出的時候,out是一個JspWriter实现类的对象实例,JspWriterImpl(ServletResponse response, int sz, boolean autoFlush)是一个该类的构造函数,其使用到了response,在JspWriterImpl内部还有一个java.io.Writer对象实例的引用,在使用JspWriter(JSP的out对象)写出数据的时候,会调用如下的函数来初始化

protected void initOut() throws IOException

    {

        if(out == null)

        {

            out = response.getWriter();初始化 java.io.Writer對象

        }

    }来初始化该内部对象的。

然后在jspWriter的各个输出数据的函数的实现中就是調用上面的java.io.Writer對象的方法的。

    所以不论是jsp或者是servlet,对客户端写出html的時候,都是通过response.getWriter();来得到的字符流或者由getOutputStream()得到2进制流的。

   一個response存在一個字符流,也存在一個2進制流,但是在同一時刻只能打開使用一個流的。至於兩者的關係,我們在後面介紹。Jsp的out對象就是response的字符流的。

  同樣的request也存在一個字符流和一個2進制流,但是在同一時刻只能打開使用一個流的。

response的两个流的关系

    我们来考察response的实现类的getOutputStream()和getWriter函数的实现:

public ServletOutputStream getOutputStream()        throws IOException

    
...{

      。。。。。。。。。。。。。。。。。。。。。

            stream 
= createOutputStream();创建response的2进制的输出流

   。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

        
return stream;

    }


public PrintWriter getWriter()        throws IOException

 
...{

     。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

           ResponseStream newStream 
= (ResponseStream)createOutputStream();创建2进制流

。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

            OutputStreamWriter osr 
= new OutputStreamWriter(newStream, getCharacterEncoding());

            writer 
= new ResponseWriter(osr, newStream);得到response的字符输出流

 。。。。。。。。。。。。。。。。。。。。。。。。。。

        }


    }

显然,我们的字符流就是从2进制流转化而来的

    还有两个函数要注意:

public String getCharacterEncoding()response的编码,默认是ISO-8859-1的

    
...{
分享到:
评论

相关推荐

    Tomcat中文乱码处理方法.docx

    Tomcat中文乱码处理方法.docx

    tomcat 下catalina.out 日志乱码问题处理

    部署tomcat下的项目 监控的时候发现 日志中文乱码 ,tomcat 下catalina.out 日志乱码问题处理

    Tomcat 7 API文档

    Tomcat 7 API文档。...另外,Tomcat和IIS等Web服务器一样,具有处理HTML页面的功能,另外它还是一个Servlet和JSP容器,独立的Servlet容器是Tomcat的默认模式。不过,Tomcat处理静态HTML的能力不如Apache服务器。

    《深入剖析Tomcat(中文版+英文版)》.rar

    《深入剖析Tomcat(中文版+英文版)》.rar 《深入剖析Tomcat》深入剖析Tomcat 4和Tomcat 5中的每个组件(如果TOMCAT版本有点老,不过现在的Tomcat6和7同样可以借鉴参考),并揭示其内部工作原理。通过学习《深入剖析...

    tomcat过滤器,处理表单提交出现乱码

    处理表单提交页面出现乱码现象,第三方开发。

    关于Tomcat和jsp经验总结

    tomcat ,tomcat ,tomcat ,tomcat ,tomcat ,tomcat ,tomcat ,tomcat ,tomcat ,对JSP开发中容易出现的一些错误的总结,有出现错误的截图以及解决方法,包括了jsp页面的一些常见错误,控制台出现的错误,中文乱码处理、...

    Tomcat6_优化_方案

    maxThreads="1000" 最大线程数,因为每个请求Tomcat都会使用一个线程来处理,所以代表最大同时请求数 8. 可以粗略认为,同一时间点(如1毫秒内)最大同时并发数 = acceptCount + maxThreads, 9. 但实际上每秒处理的...

    apache-tomcat-9.0.1汤姆猫服务器

    Tomcat 中文名:汤姆猫,Tomcat 服务器是一个免费的开放源代码的Web 应用服务器,属于轻量级应用服务器。Tomcat 实际上运行JSP 页面和Servlet。另外,Tomcat和IIS等Web服务器一样,具有处理HTML页面的功能,另外它...

    jaxmao-tomcat-5.5.20中文版

    另外,Tomcat和IIS、Apache等Web服务器一样,具有处理HTML页面的功能,另外它还是一个Servlet和JSP容器,独立的Servlet容器是Tomcat的默认模式。不过,Tomcat处理静态HTML的能力不如Apache服务器。

    Tomcat和jsp的乱码处理和Myeclipse光标跳动的解决

    解决常见的jsp的乱码方法和Tomcat的中文问题 解决Myeclipse的光标跳动的小BUG

    Tomcat+Jsp环境下的中文问题

    摘要:关于Java应用在处理中文时所存在问题的讨论已经相当多了,与大部分的讨论不同,本文将从汉字字符的输入和输出的角度来讨论Java语言处理中文时所存在的问题。尽管关于Java在处理中文字符时所存在的问题的讨论已...

    如何配置Filter过滤器处理JSP中文乱码

    配置Filter过滤器处理JSP中文乱码 参考Tomcat服务器目录webapps的examples示例 简单配置步骤: 1.在项目web.xml文件添加过滤器标记和; 2.实现过滤器代码; 3.对Tomcat服务器conf目录里的Server.xml文件配置...

    Ajax实例,处理了中文乱码

    一个Ajax的初学小例子,包括两个文件,getText.html,zipecode.jsp.在zipecode里输入1,2,3会从jsp里读取对应的city和prov并放到对应的文本框...并且做了中文处理,输入“徐家汇”会得到邮编等。在Tomcat6下测试通过。

    Java乱码问题解决

    在Java编程中,经常会碰到汉字的处理及显示问题,以不小心就会产生一大堆乱码或者问号。造成这种问题的根本原因是Java中默认的编码方式是Unicode,而中国人通常使用的文件和DB都是基于GB2312或BIG5等编码,故会出现...

    快速搭建移动App服务器 (win+tomcat+轻开平台+access入门版)

    EditPlus 是一款功能强大的文字处理软件。它可以充分的替换记事本,它也提供网页作家及程序设计师许多强悍的功能。支持 HTML、CSS、PHP、ASP、Perl、C/C++、Java、JavaScript、VBScript 等多种语法的着色显示。程序...

    Eclipse开发分布式商城系统+完整视频代码及文档

    中文分析器配置.avi │ 12.导入数据-dao.avi │ 13.索引库导入数据-完成.avi │ 淘淘商城第七天笔记.doc │ ├─08.第八天 │ 14.搜索服务切换到集群.avi │ 01.课程计划.avi │ 02.课程计划.avi │ 03.搜索服务-...

    jfreechart解决中文乱码,柱状图有详细的注释

    将jfreechart.war包放入tomcat里,启动tomcat 在浏览器里输入:http://localhost:8080/jfreechart/index.jsp看见的是柱状图,输入:http://localhost:8080/jfreechart/index2.jsp看见的是饼状图。 供大家学习

    人工智能-项目实践-搜索引擎-Web信息检索与处理课程实验1-一个简易的搜索引擎

    Web信息检索与处理课程实验1——一个简易的搜索引擎 实验内容 利用Lucene等工具建立简单的搜索引擎: 1.网页预处理 2.创建索引(使用中科院中文分词工具ICTCLAS) 3.查询(实现简单的查询界面) 实验环境 编译...

    AJAX JSP 聊天室1.0 源码(JSP)

    // 下面这句只是为了在 Tomcat 下面运行的字符集问题, 其它 Server 请酌情处理 msgs = changeEncoding(msgs, "ISO8859-1", "UTF-8"); 并把注释行下的转码方法删掉即可在 Resin 等中文支持较好的服务器上运行, ...

Global site tag (gtag.js) - Google Analytics