如何实现汉字转化
如果要支持国际化,那么页面的编码必须为UTF-8,因为客户端的浏览器都支持UTF-8编码。
下面做个简单的测试:
建立一个html文件,内容很简单,如下
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
</HEAD>
<BODY>
这是一个中文字符串<BR>
这是一个中文字符串
</BODY>
</HTML>
以上代码保存后,在IE中打开,你可以看到
这是一个中文字符串
Β???
第二行显示的可能不同机器显示不一样,但是应该都是乱码。
下面进行第二步,返回刚才的页面,修改浏览器的编码方式,可以看得到
无论怎么改变编码方式,第一行永远现实的是“这是一个中文字符串”,只有在编码方式为简体中文的时候,第二行才不显示乱码。
所以,如果要你的web站点支持国际化,那么除了编码方式要为UTF-8,而且页面中的中文部分(包括中文的标点符号)都要经过UNICODE编码。
UTF-8编码工具:
方法一: JDK的native2ascii工具
native2ascii-本地码-至-ASCII 码转换器
将含有本地编码字符(既非 Latin1 又非 Unicode 字符)的文件转换为 Unicode 编码字符的文件。
结构
native2ascii [options] [inputfile [outputfile]]
说明
Java 编译器和其它 Java 工具只能处理含有 Latin-1 和/或 Unicode 编码(\udddd 记号)字符的文件。native2ascii 将含有其它字符编码的文件转换成含 Latin-1 和/或 Unicode 编码字符的文件。
若省略 outputfile,则使用标准输出设备输出。此外,如果也省略 inputfile,则使用标准输入设备输入。
选项
-reverse
执行相反的操作:将含 Latin-1 和/或 Unicode 编码字符的文件转换成含本地编码字符的文件:
-encoding encoding_name
指定转换过程使用的编码名称。缺省的编码从系统属性 file.encoding 中得到。encoding_name 字符串必须是符合要求的字符串。
比如可以这样利用native2ascii:
native2ascii -encoding gbk application_zh_CN.properties temp.properties
这里将根据application_zh_CN.properties输出了一个临时文件temp.properties,然后把application_zh_CN.properties中的文件内容替换为这个临时文件的内容就可以了。
转换后的application_zh_CN.properties
# Hello\u5b9e\u4f8b\u4f7f\u7528\u7684\u8d44\u6e90\u6587\u4ef6
hello.title=\u7b2c\u4e00\u4e2aStruts\u5e94\u7528
hello.prompt.user=\u8bf7\u8f93\u5165\u7528\u6237\u540d
hello.page.hello=\u4f60\u597d
hello.page.wellocome=\u6b22\u8fce\u6765\u5230Javamxj\u7684Blog
这样的操作对于一个或两个资源文件还行,如果多个资源文件,这样未免有些太麻烦了。你可以建立一个批处理文件(.bat);或者建立一个Ant文件,利用其包含的native2ascii任务,也可以进行批处理。
方法二: UTF-8 转换工具,这是一个JS脚本,保存后可以对输入的字符串进行转换,代码如下
<html>
<head>
<title>UTF8 转换工具</title>
<div align=center>
<center>
<table border=0 cellpadding=0 cellspacing=0 style="border-collapse: collapse" width=600 id=AutoNumber1 height=26>
<tr>
<td width=100% height=26>
<p align=center><font face=黑体 size=5 color=#FF0000>UTF-8 转换工具</font></p>
<p>使用方法:</p>
<p> 在下面的文本框中输入中文文字,按“转化”,即可将其转化为UTF-8字符。</p>
<p> 再按“还原”,即可将其还原为简体中文。</td>
</tr>
</table>
</center>
</div>
<p align=center>
<textarea cols=82 rows=10 id=code>
</textarea> </p>
<p align=center>
<input type=button onclick=encode(code,this) value=转化>
<script>
var mode="zhuan";
function encode(obj,btn){
if(mode=="zhuan"){
obj.value=obj.value.replace(/[^\u0000-\u00FF]/g,function($0){return escape($0).replace(/(%u)(\w{4})/gi,"&#x$2;")});
btn.value="还原";
mode="huan";
}else{
obj.value=unescape(obj.value.replace(/&#x/g,'%u').replace(/;/g,''));
btn.value="转化";
mode="zhuan";
}
}
</script></p>
分享到:
相关推荐
1、itext将静态html转pdf中文显示及换行问题 2、itext将静态html转pdf 字体问题 3、html转pdf 参考我的另外一篇博文https://blog.csdn.net/qq_38616723/article/details/125188407?spm=1001.2014.3001.5502
java用pdfbox转pdf为图片文件时,如果pdf有中文,则会出现乱码(windows下正常,linux下乱码),改用icepdf后问题解决,而且能够轻松设置欲转换成图片的格式和大小.icepdf对中文支付非常强大,以下是实例代码,可以...
如果遇到了 pdf 转图片时无法加载字体包,只可以将字体文件复制再系统 中 linux usr/lib/fonts 下即可 window 放到 user/lib/fonts 下即可 ,基本大家遇到的都可能是 中文字体无法识别我在这里放了 本人之前用到的 ...
中文姓名生僻字输入以及汉字全拼一直是个老难题,经过我的整理改进,现共享这个文档,经检查此文档存在部分汉字没有对应转换以及汉字姓多音的两个问题,文档说明中以及提供解决方案(因本人找不到oracle的汉字字符...
1、解决HTML转pdf 中文、数字、英文不能换行的问题,修改的源码包 重新计算了右边距。 2、html转pdf 参考我的另外一篇博文https://blog.csdn.net/qq_38616723/article/details/125188407?spm=1001.2014.3001.5502
c++乱码问题——转中文.txt
1、core-renderer.jar该jar包修改过中文不换行问题 public static String getConversionHtmlCode(String linkcss,String htmlCode,String title){ String css = ""; css +="<style>"; css +="table{"; ...
本工具是把EXCEL文件中某一列的中文数据转换为其拼音首字母缩写的工具,本人也只是工作需要才写的这个工具,现在已经用完,哪位哥么需要类似的工具尽管拿去用吧。 由于只是临时用的,可能会有那么一点小BUG,不过...
前言:最近处理一个特殊的问题,需要用到汉字自动转换拼音的功能。 解决:网上找了不少资料,都是有所缺陷,而且也好像很绕。其实是一个很简单的东东。后来还是自己写了一个函数获取。 这是一个比较简单的汉字转拼音...
这个时候搜索内存时 就需要把汉字转换成unicode的形式 这个小工具就能帮上大忙了。。 注意这个版本有点小问题 就是初始化的时候显示我信息的Unicode 没有。这是我调试时候方便 在初始化窗口的时候注释掉了。。其它...
解决HTML转pdf 中文、数字、英文不能换行的问题,修改的源码包 重新计算了右边距
在html转化为pdf时,解决中文不显示问题,要用到的中文字体包 simsun.tt
1、解决中文问题 2、附字体 3、动态html拼接转pdf public static void htmlCodeComeString(String linkcss,String htmlCode, String outputFile,String title) throws Exception { OutputStream os = new ...
注意:此代码是利用itext将静态html转为pdf,非url转pdf 项目为maven项目,注意pom.xml文件中的jar包 解决了中文不显示及不换行的问题 https://blog.csdn.net/woweipingzui/article/details/82017089
txt转换pdf,解决中文问题
纯字库转换,包含几乎所有汉字,网上现有传播的转换都是unicode编码转换,其中很多字不在字库内,举例:瑛(ying)无法识别,存在很多问题,本代码直接字库转换,且公开文本,没有找到的字还可以添加到字库。...
xpdf用来处理swftools将转换pdf中文问题
解决汉字首字母排序问题,全部拼音排序未解决
针对java实现Txt转换PDF乱码以及字体问题的解决内付代码。亲测有效。。。txt转换pdf,解决中文问题