`
virtual_function
  • 浏览: 127940 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

使用Epublib解析EPub文件

阅读更多

Epublib是一个用于处理epub文件的java类库,可以对epub文件进行读写处理;而且提供了一个阅读器,可以直接运行(java -jar 方式),并可以打开epub类型的文件进行阅读;(引用官方网页的一句话:Epublib is a java library for managing epub files. It’s capable of reading and writing epub files programmatically.

 

Epublib 主页:http://www.siegmann.nl/epublib

Epub viewer的地址:https://github.com/downloads/psiegman/epublib/epublib-viewer-latest.jar

在线API:http://www.siegmann.nl/static/epublib/apidocs/

 

 

容易遇到的问题:在epublib的网页上并没有提到epublib所依赖的jar,那么在创建epub文件的时候,就会报如下异常:

 

 

Exception in thread "main" java.lang.NoClassDefFoundError: org/xmlpull/v1/XmlPullParserFactory
	at nl.siegmann.epublib.epub.EpubProcessorSupport.createXmlSerializer(EpubProcessorSupport.java:80)
	at nl.siegmann.epublib.epub.EpubProcessorSupport.createXmlSerializer(EpubProcessorSupport.java:74)
	at nl.siegmann.epublib.epub.NCXDocument.createNCXResource(NCXDocument.java:181)
	at nl.siegmann.epublib.epub.NCXDocument.createNCXResource(NCXDocument.java:177)
	at nl.siegmann.epublib.epub.EpubWriter.initTOCResource(EpubWriter.java:67)
	at nl.siegmann.epublib.epub.EpubWriter.write(EpubWriter.java:51)
	at org.lazyboy.work.document.EPubUtil.createNewFile(EPubUtil.java:124)
	at org.lazyboy.work.document.EPubUtil.main(EPubUtil.java:144)
Caused by: java.lang.ClassNotFoundException: org.xmlpull.v1.XmlPullParserFactory
	at java.net.URLClassLoader$1.run(URLClassLoader.java:202)
	at java.security.AccessController.doPrivileged(Native Method)
	at java.net.URLClassLoader.findClass(URLClassLoader.java:190)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:307)
	at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:301)
	at java.lang.ClassLoader.loadClass(ClassLoader.java:248)
	... 8 more
 

 

根据提示:org.xmlpull.v1.XmlPullParserFactory类没有找到,那么就去找合适的jar吧·····你会发现有很多jar里包含了这个类,但是如果不巧你添加了jar包之后,虽然没有了这个异常,但是你会遇到另一个空指针的异常,如下所示:

 

 

Exception in thread "main" java.lang.NullPointerException
	at org.xmlpull.mxp1_serializer.MXSerializer.startDocument(MXSerializer.java:379)
	at nl.siegmann.epublib.epub.PackageDocumentWriter.write(PackageDocumentWriter.java:38)
	at nl.siegmann.epublib.epub.EpubWriter.writePackageDocument(EpubWriter.java:112)
	at nl.siegmann.epublib.epub.EpubWriter.write(EpubWriter.java:53)
	at org.lazyboy.work.document.EPubUtil.createNewFile(EPubUtil.java:124)
	at org.lazyboy.work.document.EPubUtil.main(EPubUtil.java:144)
 

 

那就是你加错jar包了,经过多次试验后,发现应该加入一个kxml2的jar包,其maven坐标如下:

 

 

	<dependency>
		<groupId>kxml2</groupId>
		<artifactId>kxml2</artifactId>
		<version>2.2.2</version>
	</dependency>

 

 本人需要做的操作是:读取一个epub文件,取出需要的chapter,生成一个新的epub文件,或者根据比例对源epub文件进行裁剪;在此过程中遇到了问题,在blog上记录一下

 


分享到:
评论
6 楼 JazzyYang 2012-04-05  
JazzyYang 写道
我想弱弱的问下~~我怎么读到章节信息啊??就是如同目录展示的那样的~我找了老半天木有找到api的方法哦

博主,,我已经解决了,谢谢啦
5 楼 JazzyYang 2012-04-05  
我想弱弱的问下~~我怎么读到章节信息啊??就是如同目录展示的那样的~我找了老半天木有找到api的方法哦
4 楼 virtual_function 2012-03-08  
huoyanyanyi10 写道
楼主 <dependency>
<groupId>kxml2</groupId>
<artifactId>kxml2</artifactId>
<version>2.2.2</version>
</dependency>
发在那里
请赐教




这是maven的坐标啊 如果不会用maven的话 就用这个kxml2的jar包就行了····
3 楼 huoyanyanyi10 2012-03-07  
楼主 <dependency>
<groupId>kxml2</groupId>
<artifactId>kxml2</artifactId>
<version>2.2.2</version>
</dependency>
发在那里
请赐教
2 楼 virtual_function 2012-02-07  
yur630 写道
楼主 , 同在研究 Epublib ,我读到了章节信息,但是怎么读到章节内容啊,求赐教!!!



List<TOCReference> list = book.getTableOfContents().getTocReferences();
   for (TOCReference reference : list) {
      System.out.println(new String(reference.getResource().getData()));
   }


你试试吧
1 楼 yur630 2012-01-16  
楼主 , 同在研究 Epublib ,我读到了章节信息,但是怎么读到章节内容啊,求赐教!!!

相关推荐

    epublib解析

    epublib的解析流程分析,解读著名的开源epub文件解析库

    Java的EPUB类库 Epublib源码

    Java的EPUB类库 Epublib源码

    JAVA上百实例源码以及开源项目

    2个目标文件,FTP的目标是:(1)提高文件的共享性(计算机程序和/或数据),(2)鼓励间接地(通过程序)使用远程计算机,(3)保护用户因主机之间的文件存储系统导致的变化,(4)为了可靠和高效地传输,虽然用户...

    JAVA上百实例源码以及开源项目源代码

    2个目标文件,FTP的目标是:(1)提高文件的共享性(计算机程序和/或数据),(2)鼓励间接地(通过程序)使用远程计算机,(3)保护用户因主机之间的文件存储系统导致的变化,(4)为了可靠和高效地传输,虽然用户...

    java开源包8

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包1

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包11

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包2

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包3

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包6

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包5

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包10

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包4

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包7

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包9

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    java开源包101

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

    Java资源包01

    Tomcat Native 这个项目可以让 Tomcat 使用 Apache 的 apr 包来处理包括文件和网络IO操作,以提升性能。 预输入搜索 Cleo Cleo 是一个灵活的软件库用于处理一些预输入和自动完成的搜索功能,该项目是 LinkedIn 公司...

Global site tag (gtag.js) - Google Analytics