导入包
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import org.apache.poi.POIXMLDocument;
import org.apache.poi.POIXMLTextExtractor;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.hwpf.usermodel.Paragraph;
import org.apache.poi.hwpf.usermodel.Range;
import org.apache.poi.hwpf.usermodel.Table;
import org.apache.poi.hwpf.usermodel.TableCell;
import org.apache.poi.hwpf.usermodel.TableIterator;
import org.apache.poi.hwpf.usermodel.TableRow;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
import org.junit.Test;
//读取word
@Test
public void readWord(){
try {
//word 2003:图片不会被读取
InputStream is = new FileInputStream(new File("D:/资料/ldj/poi读取word/Test/files/2003.doc"));
WordExtractor ex = new WordExtractor(is);
String text2003 = ex.getText();
System.out.println(text2003);
//word 2007 图片不会被读取, 表格中的数据会被放在字符串的最后
OPCPackage opcPackage = POIXMLDocument.openPackage("D:/资料/ldj/poi读取word/Test/files/2007.docx");
POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);
String text2007 = extractor.getText();
System.out.println(text2007);
} catch (Exception e) {
e.printStackTrace();
}
}
//读取word中的表格
@Test
public void readWordTable(){
try {
String[] s=new String[300];
FileInputStream in=new FileInputStream("D:/资料/ldj/poi读取word/Test/files/757900130000-计生委.doc");
POIFSFileSystem pfs=new POIFSFileSystem(in);
HWPFDocument hwpf=new HWPFDocument(pfs);
Range range =hwpf.getRange();
TableIterator it=new TableIterator(range);
int index=0;
while(it.hasNext()){
Table tb=(Table)it.next();
for(int i=0;i
//System.out.println("Numrows :"+tb.numRows());
TableRow tr=tb.getRow(i);
for(int j=0;j
//System.out.println("numCells :"+tr.numCells()); //
//System.out.println("j :"+j);
TableCell td=tr.getCell(j);
for(int k=0;k
//System.out.println("numParagraphs :"+td.numParagraphs());
Paragraph para=td.getParagraph(k);
s[index]=para.text().trim();
System.out.print(s[index]);
index++;
}
System.out.print(" ");
}
System.out.println("");
}
}
// System.out.println(s.toString());
for(int i=0;i
//System.out.println(s[i]);
}
} catch (Exception e) {
e.printStackTrace();
}
}
相关推荐
值得注意的是 POI 在读取 word 文件的时候不会读取 word 文件中的图片信息 还有就是对于 2007 版的 word docx 如果 word 文件中有表格 所有表格中的数据都会在读取出来的字符串的最后 ">这是一个POI读取word 2003 和...
POI读取word文档的文字内容和图片内容
利用POI读取excel写入到word 利用POI读取excel写入到word 利用POI读取excel写入到word,压缩包里包含了jar包
apach poi 读取word 文档 jar 包。 博文链接:https://wxinpeng.iteye.com/blog/231881
poi读取word代码,可以通过此代码实现对word中的文本、图片、表格的读取。
利用poi读取word模板文件,并回填逻辑数据,生成并导出需要的word文档源码。解决模板读取异常问题,提供wordUtils工具类(各种功能实现)
Java通过POI读取Excel遍历数据,根本word模板批量生成word文档,demo可运行,可根据需求修改
Java读取Word中的表格(Excel),并导出文件为Excel
Java读取Word文档中指定位置(可以自己自定义位置)的表格数据或文本内容 * @param filePath 文档路径 * @param start 指定位置开始读取表格数据的该位置上的字符串 * @param end 指定位置开始结束读取表格数据的该...
使用JDK1.4,poi读取.doc的内容和表格内容以及.xls,不支持docx和xlsx。
poi-tl解析Word文档,包含表格类型的也可以
java准确读取word页码,正确率100%,请结合本文查看http://blog.csdn.net/tiandixuanwuliang/article/details/71298406
2、testpoi.java文件(直接运行),是实现读取word文档中的表格的功能,可指定读取word文档中某行某列的文本的内容 3、poidemo是一个web工程,运行后,点击首页中的下载按钮,跳转到ReadWriteAndDownloadDocServlet,...
最近因项目开发的需要,整理了一份用JAVA导出WORD文档,其部署步骤如下: 1、将jacob-1.14.3-x86.dll放在服务器的系统盘...以上配置配好后即可加载exp_java_word_demo项目,里面有示例代码,望对有需要的人有所帮助!
主要介绍了java使用poi读取ppt文件和poi读取excel、word示例,需要的朋友可以参考下
poi操作word文档所需的jar包,可以读取文档中的段落表格等内容。
使用poi3.9操作docx中书签,实现书签的替换,书签实现word中表格的新增行功能。包括实例类,工具类,poi3.9 jar包
网络上的根据模板填充Word我都看过一些, 它们的功能在数据换行的时候用的是run对象的.addCarriageReturn()方法,或者是直接用\n...换行的word导致另一个程序读取的时候整个段落全部读取,而分段则会一段一段的读取。
不使用书签读取word中表格中的信息,对于合并和拆分单元格的情况也适用,但是要准确的定位。
用于java使用poi技术,读取word文档,和生成excel表格