java解析Office文档最有名的开源包当属Apache的Poi,目前的版本已支持Office 2007文档解析,同时向下兼容。
下面是简单的解析代码:
import java.io.File;
import org.apache.poi.POITextExtractor;
import org.apache.poi.extractor.ExtractorFactory;
public class DocxParser {
/**
* @param args
*/
public static void main(String[] args) {
try {
File inputFile = new File("D:\\test.docx");
//File inputFile = new File("D:\\test.pptx");
//File inputFile = new File("D:\\test.xlsx");
//File inputFile = new File("D:\\test.xls");
//File inputFile = new File("D:\\test.doc");
//File inputFile = new File("D:\\test.ppt");
POITextExtractor extractor = ExtractorFactory
.createExtractor(inputFile);
System.out.println("Document Text: ");
System.out.println("====================");
System.out.println(extractor.getText());
System.out.println("====================");
} catch (Exception ex) {
ex.printStackTrace();
}
}
}
我的包如下:
dom4j-1.6.1.jar
geronimo-stax-api_1.0_spec-1.0.jar
ooxml-schemas-1.0.jar
xmlbeans-2.3.0.jar
log4j-1.2.13.jar
poi-3.5-beta6-20090622.jar
poi-contrib-3.5-beta6-20090622.jar
poi-ooxml-3.5-beta6-20090622.jar
poi-scratchpad-3.5-beta6-20090622.jar
可从下列的URL下载最新包:
http://labs.xiaonei.com/apache-mirror/poi/
http://www.apache.org/dyn/closer.cgi/poi/
Log4j在Java WebApp的配置 http://fonter.iteye.com/blog/418570
J2ME to android之学习笔记 http://fonter.iteye.com/blog/416112
安装Jar提示“jar文件无效”的另一个奇怪原因 http://fonter.iteye.com/blog/414188
J2ME代码认证证书的支持情况 http://fonter.iteye.com/blog/413357
S40平台播放多媒体时内存优化 http://fonter.iteye.com/blog/413022
SUN的J2ME源代码下载 http://fonter.iteye.com/blog/412094
J2ME也玩GZIP,哈哈!http://fonter.iteye.com/blog/411284
开源一个J2ME解析类 http://fonter.iteye.com/blog/409830
手机中的重定向问题及处理 http://fonter.iteye.com/blog/400836
J2ME如何通过cmwap直接访问互连网 http://fonter.iteye.com/blog/400868
安装JAD时提示JAD无效原因之一 http://fonter.iteye.com/blog/400888
J2ME网络交互之优化 http://fonter.iteye.com/blog/405137
解决Eclipse无法调试J2ME程序的配置方法 http://fonter.iteye.com/blog/405697
J2ME模拟器加载RMS时突然失效的原因 http://fonter.iteye.com/blog/407576
J2ME飞信协议分析(初稿) http://fonter.iteye.com/blog/408385
分享到:
相关推荐
android 操作office文档 doc docx xls xlsx ppt pptx pdf
docx,xlsx,pptx,pdf文档搜索工具,可以在不打开docx,xlsx,pptx,pdf文档的情况下搜索文档中内容 当我们的文档内容特别多,又记不住以前的信息到底保存在哪个位置的哪个文档的时候,本软件可以帮助你火速找到你搜索的...
使用spring boot打造文件文档在线预览项目解决方案,支持doc、docx、ppt、pptx、xls、xlsx、zip、rar、mp4、mp3以及众多类文本如txt、html、xml、java、properties、sql、js、md、json、conf、ini、vue、php、py、...
数擎XLSX/DOCX/PPTX文件恢复软件可以恢复Office2007、Office2010、Office2013、Office2016、Office2017、Office2019保存的扩展名是xlsx和docx和pptx的办公文件,具有碎片扫描恢复重组的功能。特别适合于U盘等FAT32...
原来传了word转pdf转swf的方法,后来发现不能转换docx xlsx pptx,现在将可以转换docx xlsx pptx的jar包和java例子上传,希望对大家有用
office多种类型文件(docx dotx xlsx xltx pptx ppsx potx 空文件打包为zip包)
office办公文档doc、docx、xls、xlsx、ppt、pptx在线预览java代码,本项目为springboot项目,方便搭建运行
使用jacob,poi来实现在线访问docx,xlsx,pptx的文件
docx,xlsx,pptx打不开office下载最小安装升级组件,解决office2007文件打不开等的问题。
docx,pptx,xlsx 文件在线预览
读取txt、doc、docx、pptx、xls、xlsx,以及文件下载 需要下载jxl和tm
支持word2003的文件格式分析(doc, xls, ppt),也支持(docx, xlsx, pptx)文件格式分析,全图形化界面工具; 本人也在从事pdf, word2003, openxml文件格式相关开发
功能: 无需密码去除OFFICE文件(DOCX、PPTX、XLSX)的编辑限制、修改限制、只读限制。 无需密码去除PDF文件的编辑、打印、修改等权限。
数擎XLSX/DOCX/PPTX文件恢复软件可以恢复Office2007、Office2010、Office2013保存的扩展名是xlsx和docx和pptx的办公文件,具有碎片扫描恢复重组的功能。特别适合于U盘等FAT32分区里面因为经常编辑修改而形成了碎片的...
Microsoft Office 2010 筛选器(添加docx/pptx/xlsx格式搜索支持)
使用poi,pdfbox读取doc,docs,ppt,pptx,xls,xlsx,pdf,txt等各类文件内容,包含代码和jar包
使用POI将office(doc/docx/ppt/pptx/xls/xlsx)文件转html格式
在不离开浏览器的情况下,直接查看DOCX,PPTX,XLSX,电子表格文件。 无需服务器转换即可读取其内容。 使用此DOCX查看器,您可以直接查看DOCX,PPTX,XLSX,电子表格文件,而无需离开浏览器。 它可以帮助您打开DOCX...
unioffice是一个用于创建Office Open XML文档(.docx,.xlsx和.pptx)的库。 它的目标是成为用于创建和编辑docx / xlsx / pptx文件的最兼容,性能最高的Go库。 需要go1.8 +,构建unioffice是用于创建Office Open XML...