介绍一个PDF的生成方案

全部 Hibernate Spring Struts iBATIS 企业应用 Lucene SOA Java综合 Tomcat 设计模式 OO JBoss

浏览 150928 次

锁定老帖子主题：介绍一个PDF的生成方案该帖已经被评为良好帖
作者	正文
downpour 等级: 性别: 文章: 1516 积分: 2448 来自: 上海	发表时间：2009-11-03 最后修改：2009-11-03 相关推荐: itext的PDF生成方案 Java PDF生成方案介绍及问题汇总 QT5生成PDF 一种交互式SQL生成方案 (1).pdf 干撸一个Node环境的PDF生成服务更多相关推荐在Java世界，要想生成PDF，方案不少。最近一直在和这个东西打交道，所以简单做一个小结吧。在此之前，先来勾画一下我心中比较理想的一个解决方案。在企业应用中，碰到的比较多的PDF的需求，可能是针对某个比较典型的具备文档特性的内容，导出成为PDF进行存档。由于我们现在往往使用一些开源框架，诸如ssh来构建我们的应用，所以我们相对熟悉的方案是针对具体的业务逻辑设计实体，使用开源框架来实现我们的业务逻辑。而PDF的导出，最好不要破坏现有的程序框架，甚至能复用我们业务逻辑层的代码。因为如果把PDF作为一种特殊的表现形式的话，实际上它有点类似模板。最佳的情况，是我们能够通过编写某种模板，把PDF的大概样子确定下来，然后把数据和模板做一次整合，得到最后的结果带着这个目标，开始在网上搜索解决方案。也找到了一些方案，下面简单小结一下： Jasper Report 看到的市面上采用的最多的方案，是Jasper Report。相关的文档也很多，不过很杂，需要完全掌握，我认为还是有些坡度和时间的。这个时间和坡度我认为主要来自于对iReport这个IDE的反复尝试，对里面的每个属性的摸索。 Jasper Report的设计思路，本身是不违反我上面所说的初衷的。因为我们的努力方向是先生成模板，然后得到数据，最后将两者整合得到结果。但是Jasper Report的问题在于，其生成模板的方式过于复杂，即使有IDE的帮助，我们还是需要对其中的众多规则有所了解才行，否则就会给调试带来极大的麻烦。所以，我认为Jasper Report是一个半调子方案，这种强依赖于IDE进行可视化编辑的方式令我很不爽。同时，由此带来的诸多的限制，相信也让很多使用者颇为头疼。在经历了一番痛苦的挣扎后，决定放弃使用这种方案。 iText 其实Jasper Report是基于iText的。于是有的人会说，那么直接使用iText不是一种倒退么？的确，直接使用iText似乎就需要直接使用原生的API进行编程了。不过幸好iText其实提供了一些方便的API，通过使用这些API，我们可以直接将HTML代码转化成iText可识别的Document对象，从而导出PDF文档。 import java.io.FileOutputStream; import java.io.FileReader; import java.util.ArrayList; import com.lowagie.text.Document; import com.lowagie.text.Element; import com.lowagie.text.html.simpleparser.HTMLWorker; import com.lowagie.text.html.simpleparser.StyleSheet; import com.lowagie.text.pdf.PdfWriter; public class MainClass { public static void main(String[] args) throws Exception { Document document = new Document(); StyleSheet st = new StyleSheet(); st.loadTagStyle("body", "leading", "16,0"); PdfWriter.getInstance(document, new FileOutputStream("html2.pdf")); document.open(); ArrayList p = HTMLWorker.parseToList(new FileReader("example.html"), st); for (int k = 0; k < p.size(); ++k) document.add((Element) p.get(k)); document.close(); } } 这是从网上找到的一个例子。从代码中，我们可以看到，iText本身提供了一个简单的HTML的解析器，它可以把HTML转化成我们需要的PDF的document。有了这个东西，基本上我的目标就能达成一大半了。接下来我的任务就是根据实际情况去编写HTML代码，然后扔进这个方法，就OK了。而真正的HTML代码，我们则可以在这里使用真正的模板技术，Freemarker或者Velocity去生成我们所需要的内容。当然，这已经是我们熟门熟路的东西了。正当我觉得这个方案基本能符合我的要求的时候，我也同样找到了它的很多弱项： 1. 无法识别很多HTML的tag和attribute(应该是iText的HTMLParser不够强大) 2. 无法识别CSS 如果说第一点我还可以勉强接受的话，那么第二点我就完全不能接受了。无法识别简单的CSS，就意味着HTML失去了最基本的活力，也无法根据实际要求调整样式。所以这种方案也必然无法成为我的方案。 flying sauser 在这种情况下，我几乎已经燃起了自己编写一个支持CSS解析的HTML Parser的想法。幸好，在一个非常偶然的情况下，我在google中搜到了这样一个开源项目，它能够满足我的一切需求。这就是flying sauser，项目主页是：https://xhtmlrenderer.dev.java.net/ 项目的首页非常吸引人：An XML/XHTML/CSS 2.1 Renderer。这不正是我要的东西么？仔细再看里面的文档：引用 Flying Saucer is an XML/CSS renderer, which means it takes XML files as input, applies formatting and styling using CSS, and generates a rendered representation of that XML as output. The output may go to the screen (in a GUI), to an image, or to a PDF file. Because we believe most people will be interested in re-using their knowledge of web layout, our main target for content is XHTML 1.0 (strict), an XML document format that standardizes HTML. 完美了。这东西能解析HTML和CSS，而且能输出成image，PDF等格式。哇！我们来看看sample代码(代码丑陋，不过已经能说明问题了)： /* * ITextRendererTest.java * * Copyright 2009 Shanghai TuDou. * All rights reserved. / package itext; import java.io.File; import java.io.FileOutputStream; import java.io.OutputStream; import org.xhtmlrenderer.pdf.ITextFontResolver; import org.xhtmlrenderer.pdf.ITextRenderer; import com.lowagie.text.pdf.BaseFont; /* * TODO class description * * * @author pcwang * * @version 1.0, 上午11:03:26 create $Id$ / public class ITextRendererTest { public static void main(String[] args) throws Exception { String inputFile = "conf/template/test.html"; String url = new File(inputFile).toURI().toURL().toString(); String outputFile = "firstdoc.pdf"; OutputStream os = new FileOutputStream(outputFile); ITextRenderer renderer = new ITextRenderer(); renderer.setDocument(url); // 解决中文支持问题 ITextFontResolver fontResolver = renderer.getFontResolver(); fontResolver.addFont("C:/Windows/Fonts/arialuni.ttf", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED); // 解决图片的相对路径问题 renderer.getSharedContext().setBaseURL("file:/D:/Work/Demo2do/Yoda/branch/Yoda%20-%20All/conf/template/"); renderer.layout(); renderer.createPDF(os); os.close(); } } 运行，成功！实在太简单了！API帮你完成了一切！有了这个东西，我们就可以将PDF的生成流程变成这样： 1) 编写Freemarker或者Velocity模板，打造HTML，勾画PDF的样式(请任意使用CSS)* 2) 在你的业务逻辑层引入Freemarker的引擎或者Velocity的引擎，并将业务逻辑层中可以获取的数据和模板，使用引擎生成最终的内容 3) 将我上面的sample代码做简单封装后，调用，生成PDF 这样，我想作为一个web程序员来说，上面的3点，都不会成为你的绊脚石。你可以轻松驾驭PDF了。在Flying Saucer的官方文档中，有一些Q&A，可以解决读者们大部分的问题。包括PDF的字体、PDF的格式、Image如何处理等等。大家可以尝试着去阅读。还有一篇文章，好像是作者写的，非常不错：http://today.java.net/pub/a/today/2007/06/26/generating-pdfs-with-flying-saucer-and-itext.html 声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

patrickyao1988 等级: 初级会员性别: 文章: 54 积分: 30 来自: 成都	发表时间：2009-11-03 多谢楼主分享 jasper确实不能满足太高的需求。。
返回顶楼	回帖地址 0 0 请登录后投票

carlkkx 等级: 初级会员性别: 文章: 375 积分: 80 来自: 上海	发表时间：2009-11-04 这个库不错，正是我想要的那种。
返回顶楼	回帖地址 0 0 请登录后投票

geweixin 等级: 初级会员性别: 文章: 304 积分: 10 来自: 江苏	发表时间：2009-11-04 梦里寻她千百度蓦然回首那人却在灯火阑珊处~~不错，多谢楼主分享~~
返回顶楼	回帖地址 0 0 请登录后投票

libo_591 等级: 初级会员性别: 文章: 57 积分: 30 来自: 北京	发表时间：2009-11-04 不知道楼主研究过PDF文本内容的解析么？尤其是中文PDF的。。。。
返回顶楼	回帖地址 0 0 请登录后投票

downpour 等级: 性别: 文章: 1516 积分: 2448 来自: 上海	发表时间：2009-11-04 libo_591 写道不知道楼主研究过PDF文本内容的解析么？尤其是中文PDF的。。。。你要解析PDF文本的内容做啥？貌似看不到这种需求的存在。不过网上这类解析的类库也很多，没有具体试过。
返回顶楼	回帖地址 0 0 请登录后投票

narsil 等级: 初级会员性别: 文章: 4 积分: 30 来自: 上海	发表时间：2009-11-04 最后修改：2009-11-04 中文怎么不行呀。字体好像找不到。还有就是页眉页脚怎么加进来。
返回顶楼	回帖地址 0 0 请登录后投票

zhu_chen001 等级: 初级会员性别: 文章: 79 积分: 80 来自: 南京	发表时间：2009-11-04 我中文没有显示为什么啊？
返回顶楼	回帖地址 1 0 请登录后投票

diystyle 等级: 初级会员文章: 17 积分: 32	发表时间：2009-11-04 以前一直在找这种类似的解决方案，这功能确实强大,好好研究一下，ths 楼主
返回顶楼	回帖地址 0 0 请登录后投票

blackbat 等级: 初级会员文章: 35 积分: 56 来自: 重庆	发表时间：2009-11-05 通过实验中文问题还是解决不了：楼主提供的解决方法不行， // 解决中文支持问题 ITextFontResolver fontResolver = renderer.getFontResolver(); fontResolver.addFont("C:\\Windows\\Fonts\\ARIALUNI.TTF", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED); 看了FAQ，提供的方法跟楼主差不多，还是没解决，各位解决了中文的问题没？楼主，你生成的PDF里有中文字符？
返回顶楼	回帖地址 1 0 请登录后投票

« 上一页 1 2 3 … 10 11 下一页 »

论坛首页 → Java企业应用版

跳转论坛: