`
plane
  • 浏览: 157472 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

JSP乱码解决 之 pageEncoding和contentType属性,UTF-8 GBK gb2312 详解

    博客分类:
  • java
阅读更多
文章来源于志伟教程资料网 (http://www.zhiweinet.com)。

UTF-8编码是什么?

UTF-8 编码是一种被广泛应用的编码,这种编码致力于把全球的语言纳入一个统一的编码,目前已经将几种亚洲语言纳入。UTF 代表 UCS Transformation Format.

UTF-8 采用变长度字节来表示字符,理论上最多可以到 6 个字节长度。UTF-8 编码兼容了 ASC II(0-127), 也就是说 UTF-8 对于 ASC II 字符的编码是和 ASC II 一样的。对于超过一个字节长度的字符,才用以下编码规范:

左边第一个字节1的个数表示这个字符编码字节的位数,例如两位字节字符编码样式为为:110xxxxx 10xxxxxx; 三位字节字符的编码样式为:1110xxxx 10xxxxxx 10xxxxxx.;以此类推,六位字节字符的编码样式为:1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx。 xxx 的值由字符编码的二进制表示的位填入。只用最短的那个足够表达一个字符编码的多字节串。例如:

Unicode 字符: 00 A9(版权符号) = 1010 1001, UTF-8 编码为:11000010 10101001 = 0x C2 0xA9; 字符 22 60 (不等于符号) = 0010 0010 0110 0000, UTF-8 编码为:11100010 10001001 10100000 = 0xE2 0x89 0xA0



GBK编码是什么?

GBK: 汉字国标扩展码,基本上采用了原来GB2312-80所有的汉字及码位,并涵盖了原Unicode中所有的汉字20902,总共收录了883个符号, 21003个汉字及提供了1894个造字码位。 Microsoft简体版中文Windows 95就是以GBK为内码,又由于GBK同时也涵盖了Unicode所有CJK汉字,所以也可以和Unicode做一一对应。

GB码,全称是GB2312-80《信息交换用汉字编码字符集基本集》,1980年发布,是中文信息处理的国家标准,在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯一中文编码。P- Windows3.2和苹果OS就是以GB2312为基本汉字编码, Windows 95/98则以GBK为基本汉字编码、但兼容支持GB2312。GB码共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排序,二级字3008,以偏旁排序。该标准的制定和应用为规范、推动中文信息化进程起了很大作用。

GB2312编码是什么?

GB2312-80(简称GB2312或GB80)的全称为《信息交换用汉字编码字符集—基本集》,由中国国家标准总局发布,于1981年5月实施。目前,通行于中国大陆和新加坡。

字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。早期的计算机使用7位的ASCII编码,为了处理汉字,程序员设计了用于简体中文的GB2312和用于繁体中文的big5。

GB2312(1980年)一共收录了7445个字符,包括6763个汉字和682个其它符号。汉字区的内码范围高字节从B0-F7,低字节从A1-FE,占用的码位是72*94=6768。其中有5个空位是D7FA-D7FE。

JSP pageEncoding和contentType属性


JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页, 用的是contentType。

关于JSP页面中的pageEncoding和contentType两种属性的区别:

pageEncoding是jsp文件本身的编码

contentType的charset是指服务器发送给客户端时的内容编码

JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页,用的是contentType。

第一阶段是jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。

第二阶段是由JAVAC的JAVA源码至java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。

JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。

第三阶段是Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效

contentType的設定.

pageEncoding 和contentType的预设都是 ISO8859-1. 而随便设定了其中一个, 另一个就跟着一样了(TOMCAT4.1.27是如此). 但这不是绝对的, 这要看各自JSPC的处理方式. 而pageEncoding不等于contentType, 更有利亚洲区的文字 CJKV系JSP网页的开发和展示, (例pageEncoding=GB2312 不等于 contentType=utf-8)。

jsp文件不像.java,.java在被编译器读入的时候默认采用的是操作系统所设定的locale所对应的编码。一般我们不管是在记事本还是在ue中写代码,如果没有经过特别转码的话,写出来的都是本地编码格式的内容。所以编译器采用的方法刚好可以让虚拟机得到正确的资料。

但是jsp文件不是这样,它没有这个默认转码过程,但是指定了pageEncoding就可以实现正确转码了。

举个例子:
<%@ page contentType="text/html;charset=utf-8" %>

大都会打印出乱码,因为我输入的“你好吗”是gbk的,但是服务器是否正确抓到“你好吗”不得而知。

但是如果更改为
<%@ page contentType="text/html;charset=utf-8" pageEncoding="GBK"%>



(责任编辑:志伟)

  转载请注明文章来源于志伟教程资料网 (http://www.zhiweinet.com)。
分享到:
评论

相关推荐

    JSP页面中的pageEncoding和contentType两种属性 - 51CTO_COM - 注解

    JSP页面中的pageEncoding和contentType两种属性的区别与联系。

    JSP页面中的pageEncoding和contentType两种属性的区别.

    JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页, 用的是contentType。

    JSP页面pageEncoding和contentType属性

    有关于JSP页面中pageEncoding和contentType属性。

    myEclipse乱码解决办法

    在Myeclipse导入一个项目,有中文乱码问题,解决方法如下: 一、将整个project设置编码UTF-8(UTF-8可以最大的支持国际化) windows-&gt;Preferences-&gt;general-&gt;Workspace-&gt;Text file encoding-&gt;Other框中的Text ...

    解决JSP到MySQL数据库中文乱码问题

    遇到了这个问题, 按照一定的顺序解决了, 来这里总结一下, 希望能帮助大家.  咱们从前台到后台的顺序来解决. ... charset=UTF-8" pageEncoding="UTF-8"%&gt;  &lt;meta http-equiv="Content-Type" con

    java中文乱码解决方案

    这边有必有说明的是如果是jsp+java bean+servlet的方案,中文乱码很好解决,统一设成gb2312就可以了。 1.2 使用struts框架字符集不能设成gb2312,要改成utf-8。  2. 在struts.properties 添加: struts.devMode=...

    java 的乱码教程

    首先,说说JSP/Servlet中的几个编码...charset=UTF-8"、request.setCharacterEncoding("UTF- 8")和response.setCharacterEncoding("UTF-8"),其中前两个只能用于JSP中,而后两个可以用于JSP和 Servlet中。 。。。。。

    jsp复习总结

    jsp,el表达式 1. Page指令: *" pageEncoding="utf-8"%&gt; 注意:一个页面可以有多个page指令,除了...*" pageEncoding="utf-8" errorPage="2.jsp"%&gt; a) jsp页面异常处理: *" pageEncoding="utf-8" isErrorPage="true"%&gt;

    html转jsp工具

    1、此工具只针对utf-8和gb2312两种编码格式的网页进行转换,其他编码格式的网页不支持转换! 2、此工具会自动在html页面的开始位置加入以下内容,并自动将html或者htm页面转为jsp后缀的文件 *" pageEncoding="utf-8...

    jsp连接MySQL实现插入insert操作功能示例

    @ page language=”java” pageEncoding=”utf-8″%&gt; &lt;&#37;@ page contentType=”text/html;charset=utf-8″%&gt; &lt;&#37; request.setCharacterEncoding(“UTF-8”); response.setCharacterEncoding(“UTF-8...

    PageEncoding&contentType中charset区别

    PageEncoding&contentType中charset区别,遇到了与大家分享!

    Javaweb 小练习 prj.zip

     JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用UTF-8至UTF-8,第三阶段就是由Tomcat 出来的网页, 用的是contentType。  第一阶段是jsp编译成.java,它会根据pageEncoding的设定读取jsp,...

    WEB17Project-jsp.rar 源代码

    pageEncoding:当前jsp文件的本身编码---内部可以包含contentType contentType:response.setContentType(text/html;charset=UTF-8) session:是否jsp在翻译时自动创建session import:导入java的包 errorPage:当...

    jsp解析

    jsp指令:*"pageEncoding="UTF-8"%&gt; jsp中的内置对象 &lt;form method="post" action="hao.jsp"&gt; 一:request内置对象的方法 解决中午乱码问题: request.setCharacterEncoding("utf-8"); 获取页面数据: ...

    JSP javaBean的应用

    &lt;%@page contentType="text/html" pageEncoding="UTF-8"%&gt; &lt;jsp:useBean id="qqq" scope="page" class="aaa.Account" /&gt; &lt;jsp:setProperty name="qqq" property="*" /&gt; &lt;!DOCTYPE html&gt; &lt;html&gt; &lt;head&gt; ...

    jsp cookie+session实现简易自动登录

    本文实例为大家分享了jsp cookie+session实现简易自动登录的具体代码,供大家参考,具体内容如下 关闭浏览器只会使存储在客户端浏览器内存中的session cookie失效... pageEncoding=UTF-8%&gt; &lt;!DOCTYPE html&gt; &lt;html

    jspSmartUpload.jar

    (因为该组件内部使用GBK编码,所以如果使用utf-8的话,反而从表单中会获取中文乱码)切记,同时前台jsp页面中也要做如下处理, *" pageEncoding="UTF-8"%&gt; &lt;%@ page contentType="text/html; charset=GBK"%&gt; 这里为...

    JSP上机实习报告.doc

    JSP上机实习报告 课程名称 JSP开发技术 任课老师 赵 丹 专 业 信息管理与信息系统 学 号 296 姓 名 胡 斌 JSP上机实习报告 第一题 题目 在JSP中利用Java代码计算出1+1的结果,然后在页面中显示计算结果,实现过程...

    testspringmvcproject.rar

    pageEncoding="UTF-8"%&gt; &lt;!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"&gt; &lt;%@ include file="/WEB-INF/commIncludePage/common.jsp"%&gt; &lt;meta http-...

    jsp和servlet操作mysql中文乱码问题的解决办法

    首先看是从什么地方开始出现的乱码,只要统一编码,就不会出现乱码,下面以uft-8(个人认为最好)为例,详细说明:1、如果乱码是从jsp页面出现的,jsp头部页面加上:&lt;&#37;@ page language=”java” pageEncoding...

Global site tag (gtag.js) - Google Analytics