- 浏览: 381064 次
- 性别:
- 来自: 上海
文章分类
最新评论
-
holleyangyanges:
name327 写道LZ说句打击你的话, 首先不说Https的 ...
使用httpclient4登录百度 -
holleyangyanges:
,没有登陆成功啊!
使用httpclient4登录百度 -
shenjichao2009:
...
Spring AOP原理解析 -
wuke0210:
[color=red][/color]
CKEditor3.0在asp.net环境下上传文件的配置,集成CKFinder -
wuke0210:
CKEditor3.0在asp.net环境下上传文件的配置,集成CKFinder
1、常用编码
日语的文字编码主要是Shift_JIS、EUC-JP、ISO-2022-JP这三种。
(1)Shift_JIS主要是Windows和Macintosh使用的文字编码。
Shift_JIS
的文字集合基本是按照JIS X 0208规定的。但实际上各个厂商各自进行扩展,包含了大量重复的、规格以外的文字。因此,Windows在本来的
Shift_Jis的文字集合之外,又增加了NEC扩展、IBM扩展所包含的文字。这种规格和实际情况的分歧长期存在,随着windows-31J的规格
化,混乱情况有所改善。
(2)EUC-JP是被Linux和Solaris广泛地使用的文字编码。
(3)ISO-2022-JP主要被Email使用的文字编码。 只使用7个bit,第8个bit不使用,所以不适合程序中的字符串处理,主要使用在网络中的数据交换中。
------------------------------------
2、Shift_JIS和Windows-31的不同点
Shift_JIS/Windows-31J → Unicode的映射
-----------------------------
JIS X 0208の文字 Shift_JIS/Windows-31Jのコード Shift_JIS→Unicode Windows-31J→Unicode
-----------------------------
~ (1-33, WAVE DASH) 8160 U+301C U+FF5E
∥ (1-34, DOUBLE VERTICAL LINE) 8161 U+2016 U+2225
- (1-61, MINUS SIGN) 817C U+2212 U+FF0D
¢ (1-81, CENT SIGN) 8191 U+00A2 U+FFE0
£ (1-82, POUND SIGN) 8192 U+00A3 U+FFE1
¬ (2-44, NOT SIGN) 81CA U+00AC U+FFE2
IBM独自拡張 × ○
NEC独自拡張 × ○
-------------------------------------------------
用户自定义文字,被映射到Unicode的私用领域。
转换器 Shift_JIS范围 Unicode范围
------------------------------
Windows-31J F040~F9FC E000~E757
Unicode → Shift_JIS/Windows-31J 的映射
--------------------------------------------
Unicodeの文字 Unicodeのコード Shift_JIS Windows-31J
∥ (DOUBLE VERTICAL LINE) U+2016 8161 ×
- (MINUS SIGN) U+2212 817C ×
~ (WAVE DASH) U+301C 8160 ×
- (FULLWIDTH HYPHEN-MINUS) U+FF0D × 817C
~ (FULLWIDTH TILDE) U+FF5E × 8160
¢ (FULLWIDTH CENT SIGN) U+FFE0 × 8191
£ (FULLWIDTH POUND SIGN) U+FFE1 × 8192
¬ (FULLWIDTH NOT SIGN) U+FFE2 × 81CA
总结一下,Shift_JIS和 Windows-31J 有以下两点不同:
<1>Windows-31J包括IBM的扩展文字和NEC的扩展文字。
<2>一些符号转换为Unicode的编码点是不同的。
所以,通常使用 Windows-31J可以避免一些问题。
=================================================================
3.Java中的MS932就是Windows-31J
WebLogic
Server 8.1 SP1 及更高版本的 Service Pack 使用 JDK1.4.1 或更高版本,并会影响 Shift_JIS
区域。在 WebLogic Server 7.0 及以前的版本使用的 JDK(JDK1.3) 中,“Shift_JIS”Java 编码名的别名是
“MS932”。
对
于 WebLogicServer 系统中的 IANA-Java 映射,IANA 字符集名“Shift_JIS” 作为 Java 编码名
Shift_JIS 进行处理。因此,在 JSP、Servlet 或 Web Service 使用 Shift_JIS
时,其操作将与以前版本不同。例如,MS932 专有字符(“@”等)将变为“?”。因此,如果希望一如既往地使用 MS932,则应当使用 IANA
名称“Windows-31j”。要使用 MS932,请采用下面的方法 1 或 2。
方法 1 --- 重写 JSP/Servlet 的程序文件。
--- 对于 JSP,在 page 标记中将 Shift_JIS 重写为 Windows-31J。
示例:
当 JSP 中存在以下行且使用 MS932 字符时,请将
<%@ page contentType="text/html; CHARSET=Shift_JIS" %>
重写为:
<%@ page contentType="text/html; CHARSET=Windows-31J" %>
--- 在 Servlet 中更改 setContentType() 的规范。
对于 Servlet,当存在以下规范且使用 MS932 字符时,请将
response.setContentType("text/html;charset=Shift_JIS");
重写为:
response.setContentType("text/html;charset=Windows-31J");
“Windows
-31J”是使用 IANA 正式注册的字符集名称,等同于 Microsoft 代码页 932。同样,对于 Java 来说,MS932 与
Microsoft 代码页 932 相关联。因此,Java 中的“MS932”便是 IANA 的“Windows-31J”。
实际上在 Java 中,“Windows-31J”也是 MS932 的别名。就目前而言,保持 Java 编码名与 IANA 名称的一致渐成趋势。如果将来希望使用对应于 Microsoft 代码页 932 的字符集,则强烈建议使用“Windows-31J”。
方法 2 --- 在 weblogic.xml 中更改映射(不遵从 J2EE)
在
weblogic.xml 部署描述符文件中,可以将 IANA 名称 Shift_JIS 强制映射为 Java 名称
Windows-31J。这样,您可以不必重写 JSP 或 Servlet 代码,便能够将 Shift_JIS 作为 Windows-31J
进行处理。请在 weblogic.xml 中包括以下项,然 后重新部署 Web 应用程序。
<weblogic-web-app>
<charset-params>
<charset-mapping>
<iana-charset-name>Shift_JIS</iana-charset-name>
<java-charset-name>Windows-31J</java-charset-name>
</charset-mapping>
</charset-params>
</weblogic-web-app>
但
是,这种方法是 WebLogic Server 特有的,不遵从 J2EE。换句话说,它不能与其他 J2EE Servlet 容器交互操作。
“Shift_JIS”IANA 名称为等同于 JIS X 0201 + JIS X 0208 的字符集。因此将此字符集当作 Microsoft
代码页 932 使用是不合适的。仅在由于某些原因难于更正 JSP 或 Servlet 代码时才使用此方法。
转载: http://blog.csdn.net/jackyren007/archive/2008/07/31/2743779.aspx
发表评论
-
Eclipse很卡的解决方法
2016-04-13 15:03 527配置eclipse.ini文件,可以根据内存大小视情况而定 ... -
shell 跟java 相互调用和获取结果
2011-11-08 15:16 2995被调用的shell a.sh #!/bin/bash e ... -
ITEXT 使用小结
2010-07-21 15:13 1553最近项目中使用到IText5,其实跟之前版本并无特殊差别, ... -
Java 1.5 小手册 Cheat Sheet
2009-12-26 19:07 1039Create a new object instance S ... -
SpringSide 3.2.1 寒冬日志版发布
2009-12-24 22:54 1179最近国内的开源项目非常生猛,与Play!Framework有 ... -
使用HttpComponents获取整个页面的内容
2009-12-14 11:52 2676commons-httpclient已经不再更新了, htt ... -
如何优化JAVA程序开发,提高JAVA性能
2009-12-01 13:35 989通过使用一些辅助性工具来找到程序中的瓶颈,然后就可以对瓶颈部分 ... -
weblogic11集群之建立节点信任
2009-11-24 14:56 21351、管理server和被管server的domain名字必须一 ... -
体验一下JBOSSESB The Hello World QuickStart
2009-11-16 17:26 16381)跑到 http://www.jboss.org/jboss ... -
过滤器中向所有JSP页面插入html代码
2009-10-28 16:06 2296为公司内部开发了1个简单的MVC框架,框架中需要向所有JSP页 ... -
GlassFish替换Tomcat
2009-09-29 09:34 11681. GlassFish替换Tomcat背景 ... -
禁止apache和tomcat列出目录清单的方法
2009-09-28 16:49 2181如果用户uri中没有指定文件名,apache和tomcat在默 ... -
关于apache和tomcat的连接器
2009-09-28 16:28 1433mod_jk2确实很烂。 几天的mod_jk2的云山雾罩之后 ... -
Linux下Tomcat与Apache Web服务器的整合
2009-09-28 16:21 9861、引言 基 ... -
有关使用和部署 Java 持久性体系结构 (JPA) 的案例研究
2009-04-24 17:19 10362006 年夏天发布的 EJB 3 ... -
Spring AOP原理解析
2009-04-24 15:07 10234AOP概念: 实现AOP有两种 ... -
spring aop的原理
2009-04-24 15:06 2776AOP概念 让我们从定义一些重要的AOP概念开始。 — 方 ... -
struts2的struts.properties配置文件详解
2009-04-23 16:34 929struts.action.extension ... -
详解JRE和JDK的区别
2009-02-04 11:07 1397JDK JDK 是整个Java的核心,包括了Java运行环境 ... -
jdk和jre的区别
2009-02-04 11:06 1920对于java初学者来说,往往不懂区分jdk和jre的区别,实际 ...
相关推荐
实现不同文件代码类型,诸如 Shift_JIS、EUC-JP、ISO-2022-JP、 Unicode、UTF-8 的相互変換,FREE软件
各类编码转换,从unicode 到 Shift-JIS
EUC-JP, JIS, Shift-JIS转码
"EUC-JP" "EUC-KR" "GB18030" "GB2312" "HP-ROMAN8" "IBM 850" "IBM 866" "IBM 874" "ISO 2022-JP" "ISO 8859-1" "ISO 8859-2" "ISO 8859-3" "ISO 8859-4" "ISO 8859-5" "ISO 8859-6" "ISO 8859-7" ...
Shift_JIS TIS-620 UTF-8 UTF-16BE UTF-16LE UTF-32BE UTF-32LE windows-1250 windows-1251 windows-1252 windows-1253 windows-1255 x-euc-tw X-ISO-10646-UCS-4-2143 X-ISO-10646-UCS-4-3412 x-...
青年夏尔特 它是什么? juniversalchardet是“ universalchardet”的Java端口,它是Mozilla... Shift_JIS EUC-JP 韩国人 ISO-2022-KR EUC-KR 统一码 UTF-8 UTF-16BE / UTF-16LE UTF-32BE / UTF-32LE / X-ISO-106
功能介绍 在文本字元编码之间进行转换(包括UTF-8,没有bom标记的UTF-8,UTF-16le,UTF-16be,UTF-32le,UTF-32be,中文简体GBK,中文繁体BIG5,日文 shift-JIS, 日文 euc-jp, 韩文 euc-kr等, 请参照支援的
libiconv库 [1]为需要做转换的应用提供了一个iconv的函数...EUC-JP, SHIFT_JIS, CP932, ISO-2022-JP, ISO-2022-JP-2, ISO-2022-JP-1 中文 EUC-CN, HZ, GBK, GB18030, EUC-TW, BIG5, CP950, BIG5-HKSCS, ISO-2022-CN, IS
・文字编码自動判別(Shift_JIS,JIS,EUC,Unicode,UTF-8,UTF-7) ・矩形編集 ・缩进功能 ・Grep、检索功能支持正则表达式 ・关键字、文字列定数、命令等,分颜色表示 ・支持C/C++函数、PL/SQL函数解析和跳转功能 ・...
此模块支持日语中常用的编码: Shift_JIS(CP932),ISO-2022-JP(-1),EUC-JP,UTF8,UNICODE(UCS2)转换。 纯Javascript,无需编译。 比快得多。 安装 $ npm install jconv 用法 例如,简单地从EUC-JP转换...
Added `OSF JVC Recommended Code Set Conversion Specification.
按语言划分的主要非UTF8编码: 朝鲜语:cp949,euc-kr 日语:sjis(shift_jis),cp932,euc-jp 中文:gbk,gb18030,gb2312,cp936,hkscs,big5,cp950安装npm install -g unzip-mbcs命令行界面Usage: unzip-mbcs...
EUC_JP也可能显示的多国语putty,可以选择的文字编码很多
EUC-JP,SHIFT_JIS,CP932,ISO-2022-JP(日语) EUC-KR,ISO-2022-KR,Johab(韩文) KOI8-R,MacCyrillic,IBM855,IBM866,ISO-8859-5,Windows-1251(Cyrillic) ISO-8859-5,Windows-1251(保加利亚) ISO...
将包含 EUC-KR 或 CP949 编码标签的 ID3 标签更新为 UTF-8 编码。 需要诱变剂库。 $ sudo easy_install mutagen $ cd directory_with_mp3_files $ python fix_kr_id3.py 将 EUC-KR / CP949 编码的 ID3 标签更新为...
这是字符集,是adobe工具的字符集。FZHTJW-GB1-0
汉字转换通能够简单快速的实现简体中文,繁体中文,日文中包含的汉字...目前可以实现简体中文到繁体中文,简体到日文Shift-JIS,日文EUC,繁体中文到日文Shift_JIS和日文EUC的文本双向内码转化。而且可以进行批量转换。
日文字库Sjis码表 sjis--gbk
gbk编码表,供学习使用。希望能对汉字编码做点贡献