IText中文处理问题！！！

sealbird

浏览: 603679 次
性别:
来自: 广州

最近访客更多访客>>

ladies_killer

wbsh583

u012363178

dilimic120

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Flex

引用

2008年06月05日星期四下午 10:29这里说的IText中文处理问题，是指两种生成PDF文档是对中文处理的问题：
第一种是直接通过从数据库查询，或者自己拼接中文字符串生成PDF文档。
第二种是将一个HTML文档转换成PDF文档时的中文处理。
首先说第一种：
 这种很简单，我们只需为加上这样一句：
BaseFont bf = BaseFont.createFont("STSong-Light","UniGB-UCS2-H",BaseFont.NOT_EMBEDDED);
在之后的给Document添加节点是为Paragraph设置字体时设置成BF就可以，如下：
document.add(new Paragraph("混沌之神", new Font(bf)));

源码：
 /**
 * 生成PDF文件解决中文的例子
 *
 * @throws DocumentException
 * @author Innate Solitary 
 * 创建时间：2008-6-4 下午09:47:37 
 * @throws IOException
 */
 public static void pdfWriter() throws DocumentException, IOException {
 Document document = new Document();
 PdfWriter.getInstance(document, new FileOutputStream("g:\\Hello.pdf"));
 BaseFont bf = BaseFont.createFont("STSong-Light,Bold", "UniGB-UCS2-H",
 BaseFont.NOT_EMBEDDED);
 document.open();
 document.add(new Paragraph("混沌之神", new Font(bf)));
 document.add(new Paragraph("混沌之神", new Font(bf)));
 document.close();
 }
第二种有个要求是你给的HTML文档必须XHTML文档，格式必须正确，不正确就会报解析HTML文件错误。
我在解决这个问题的时候在网上看到有人给的解决方法是修改IText中的SAXiTextHandler类的源码，在里面加上一句设置BaseFont的一句话，我测试了这样确实可行，同时也想提出这个解决方法的人致敬，他对IText理解很深入。
我们经理找到一个不用修改源码的解决方法，方法如下：
 /**
 * 将HTML文档转换成PDF文档的中文处理的例子
 *
 * @throws Exception
 * @author Innate Solitary 
 * 创建时间：2008-6-5 下午09:41:22 
 */
 public static void html2pdf() throws Exception {
 String htmlPath = "g:\\test.html";
 Document doc = new Document();
 BaseFont bf = BaseFont.createFont("STSong-Light,Bold", "UniGB-UCS2-H",
 BaseFont.NOT_EMBEDDED);
 SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
 PdfWriter.getInstance(doc, new FileOutputStream("g:\\test.pdf"));
 SAXmyHtmlHandler saxHandler = new SAXmyHtmlHandler(doc, bf);
 parser.parse(new File(htmlPath), saxHandler);
 }

上面的是源码，我将源码解释一下。
IText之所以会在处理HTML转换PDF是出错，是因为他的内部没有设置中文编码的字体转换，
即没有这三句：
BaseFont bf = BaseFont.createFont("STSong-Light", "UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);
SAXmyHtmlHandler saxHandler = new SAXmyHtmlHandler(doc, bf);
parser.parse(new File(htmlPath), saxHandler);
所以我们只需要将代码改成上面那样，就可以解决中文问题。
这里的SAXParser 是标准的DOM内的SAX解析器，没有测试其他的XML解析器可以处理这里不

分享到：

JVM调优总结 -Xms -Xmx -Xmn -Xss | 【查找结构5】多路查找树/B~树/B+树

2011-11-08 16:19
浏览 1229
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论