package com.app.doc; import java.io.File; import java.io.FileInputStream; import java.io.InputStream; import org.apache.poi.hwpf.extractor.WordExtractor; /** *poi-3.9-20121203.jar *poi-examples-3.9-20121203.jar *poi-excelant-3.9-20121203.jar *poi-ooxml-3.9-20121203.jar *poi-ooxml-schemas-3.9-20121203.jar *poi-scratchpad-3.9-20121203.jar */ public class DocWord { /** * @param args */ public static void main(String[] args) throws Exception{ String path="D:/ecmall数据字典.doc"; String text =readWordDoc(path); System.out.println(text); } /** * 读word文件的内容 * @param path * @return * @throws Exception */ public static String readWordDoc(String path) throws Exception { InputStream input=new FileInputStream(new File(path)); WordExtractor extractor = null; // 创建WordExtractor extractor = new WordExtractor(input); // 对doc文件进行提取 return extractor.getText(); } }
相关推荐
JAVA用poi解析doc、docx、slx、xlsx,代码我整合在一个类中,生成的是一个html,自己仔细阅读,大部分功能都能实现了,附带了POI3.8给大家
JAVA用poi解析doc、docx、slx、xlsx,代码我整合在一个类中,生成的是一个html,自己仔细阅读,大部分功能都能实现了,附带了POI3.8给大家
1.android本地对Word文件进行操作的所有jar包; 2.只是对Word文件的两种格式的读取操作,不涉及写操作。
把office解析成html并保存显示,doc可以解析图片等。。
基于poi实现word/excel转换为HTML(且兼容.doc.docx.xls.xlsx) 对于简单的word Excel 转换 足够。excel转换时存在火狐浏览器不兼容乱码问题,希望多多交流。
POI ,xdocreport框架是一个半成品,往往使用默认的解析结果无法满足业务需求,花了很长时间和心血研究了其源码,修复了以下问题 问题1: xdocreport能解析word转html,但解析出来的是基于word的整套html,往往我们的...
通过poi3.8 解析文件夹内的doc,并以webview加载转换后的html,点击按钮保存整个webview内容 以png图片方式保存。 doc如果有table 排版有瑕疵。 支持doc有图片。
E:\POI\word\JBoss3.0 下配置和部署EJB简介.doc文件是具有格式的,内容如图所示: 下面看看提取它的内容是多么简单。 首先从Apache网站上下载POI的相关jar包。 新建一个测试类: package org.shirdrn.word; ...
该文档的主要内容是对POI技术的使用说明,POI 技术主要是对office文件的读写控制,通过程序解析文件中的内容,或者将数据内容生成文件。操作的对象主要有:excel,doc,ppt等文件
基于POI修改的,支持android 本地解析,本地浏览,无需联网,编译通过后,打开app,点击按钮“选择TXT文件”,选择doc或docx或。。。然后点击相应的文件名即可打开预览
文件包含poi-3.17.jar、poi-examples-3.17.jar、poi-excelant-3.17.jar等jar包
java实现xml解析word文档代码实现,通过解析word书签实现java动态写入word文档。方便使用。
poi-tl相关的请参考:...至于如何转换就需要借助poi-tl的模板功能和工具类。 想要具体的Demo请看:https://gitee.com/xuwangcheng/poi-tl-html-to-word 有疑问请加QQ群:468324085 作者:白卡pala
POI提供API给Java程序对Microsoft Office格式档案读和写的功能 HSSF提供读写Microsoft Excel XLS格式档案的功能。 XSSF提供读写Microsoft Excel OOXML XLSX格式档案的功能。 HWPF提供读写Microsoft Word DOC格式档案...
Java读取Word文档中指定位置(可以自己自定义位置)的表格数据或文本内容 * @param filePath 文档路径 * @param start 指定位置开始读取表格数据的该位置上的字符串 * @param end 指定位置开始结束读取表格数据的该...
代码用maven方式引入jar包 无嵌入式...2. doc转html处理 Doc2Html.java (poi jsoup) 3. word转pdf处理 Word2Pdf.java (poi itext7) 4. word模板填充 WordUtils.java (poi XWPF) 5. 序列id生成 6. 文件处理通用工具类
java读写word文件,是java2word,而不是poi,在网上找到的poi写入,其实写的还是一个文本文档,再用poi类就打不开了
//从文件上面的xml解析 }else if(flg.equals("FILE")){ document = saxReader.read(new File(fromRead)); } Element resultEl = (Element)document.getRootElement().element("result"); Element ...