在java环境下读取xml文件的方法主要有4种:DOM、SAX、JDOM、JAXB
1. DOM(Document Object Model)
此 方法主要由W3C提供,它将xml文件全部读入内存中,然后将各个元素组成一棵数据树,以便快速的访问各个节点 。 因此非常消耗系统性能 ,对比较大的文档不适宜采用DOM方法来解析。 DOM API 直接沿袭了 XML 规范。每个结点都可以扩展的基于 Node 的接口,就多态性的观点来讲,它是优秀的,但是在 Java 语言中的应用不方便,并且可读性不强。
实例:
import javax.xml.parsers.*;
//XML解析器接口
import org.w3c.dom.*;
//XML的DOM实现
import org.apache.crimson.tree.XmlDocument;
//写XML文件要用到
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
//允许名字空间
factory.setNamespaceAware(true);
//允许验证
factory.setValidating(true);
//获得DocumentBuilder的一个实例
try {
DocumentBuilder builder = factory.newDocumentBuilder();
} catch (ParserConfigurationException pce) {
System.err.println(pce);
// 出异常时输出异常信息,然后退出,下同
System.exit(1);
}
//解析文档,并获得一个Document实例。
try {
Document doc = builder.parse(fileURI);
} catch (DOMException dom) {
System.err.println(dom.getMessage());
System.exit(1);
} catch (IOException ioe) {
System.err.println(ioe);
System.exit(1);
}
//获得根节点StuInfo
Element elmtStuInfo = doc.getDocumentElement();
//得到所有student节点
NodeList nlStudent = elmtStuInfo.getElementsByTagNameNS(
strNamespace, "student");
for (……){
//当前student节点元素
Element elmtStudent = (Element)nlStudent.item(i);
NodeList nlCurrent = elmtStudent.getElementsByTagNameNS(
strNamespace, "name");
}
对于读取得方法其实是很简单的,写入xml文件也是一样不复杂。
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = null;
try {
builder = factory .newDocumentBuilder();
} catch (ParserConfigurationException pce) {
System.err.println(pce);
System.exit(1);
}
Document doc = null;
doc = builder .newDocument();
//下面是建立XML文档内容的过程,
//先建立根元素"学生花名册"
Element root = doc.createElement("学生花名册");
//根元素添加上文档
doc.appendChild(root);
//建立"学生"元素,添加到根元素
Element student = doc.createElement("学生");
student.setAttribute("性别", studentBean.getSex());
root.appendChild(student);
//建立"姓名"元素,添加到学生下面,下同
Element name = doc.createElement("姓名");
student.appendChild(name);
Text tName = doc.createTextNode(studentBean.getName());
name.appendChild(tName);
Element age = doc.createElement("年龄");
student.appendChild(age);
Text tAge = doc.createTextNode(String.valueOf(studentBean.getAge()));
age.appendChild(tAge);
2.SAX (Simple API for XML)
此方法主要由XML-DEV 邮件列表的成员开发的,SAX是基于事件的方法,它很类似于标签库的处理机制,在标签开始、结束以及错误发生等等地方调用相应的接口实现方法,不是全部文 档都读入内存。 SAX具有优异的性能和利用更少的存储空间特点。SAX 的设计只考虑了功能的强大性,却没有考虑程序员使用起来是否方便。
使用必须扩展ContentHandler、ErrorHandler、DTDHandler等,但是必须扩展ContentHandler(或者DefaultHandler )。
import org.xml.sax.*;
public class MyContentHandler implements ContentHandler {
… …
}
/**
* 当其他某一个调用事件发生时,先调用此方法来在文档中定位。
* @param locator
*/
public void setDocumentLocator(Locator locator){
}
/**
* 在解析整个文档开始时调用
* @throws SAXException
*/
public void startDocument() throws SAXException{
System.out.println("** Student information start **");
}
/**
* 在解析整个文档结束时调用
* @throws SAXException
*/
public void endDocument() throws SAXException{
System.out.println("**** Student information end ****");
}
/**
* 在解析名字空间开始时调用
* @param prefix
* @param uri
* @throws SAXException
*/
public void startPrefixMapping(String prefix
, String uri) throws SAXException{
}
/**
* 在解析名字空间结束时调用
* @param prefix
* @throws SAXException
*/
public void endPrefixMapping(String prefix) throws SAXException{
}
/**
* 在解析元素开始时调用
* @param namespaceURI
* @param localName
* @param qName
* @param atts
* @throws SAXException
*/
public void startElement(String namespaceURI, String localName
, String qName, Attributes atts) throws SAXException{
}
/** 在解析元素结束时调用
* @param namespaceURI
* @param localName 本地名,如student
* @param qName 原始名,如LIT:student
* @throws SAXException */
public void endElement(String namespaceURI, String localName,String qName) throws SAXException{
if (localName.equals(“student”)){
System.out.println(localName+":"+currentData);
}
}
取得元素数据的方法——characters
取得元素数据中的空白的方法——ignorableWhitespace
在解析到处理指令时调用的方法——processingInstruction
当未验证解析器忽略实体时调用的方法——skippedEntity
运行时,只需要使用下列代码:
MySAXParser mySAXParser = new MySAXParser();
mySAXParser.parserXMLFile("SutInfo.xml");
3.JDOM
JDOM的处理方式有些类似于DOM,但它主要是用SAX实现的 。JDOM用Java的数据类型来定义操作数据树的各个节点 。JDOM的性能也很优越。
import org.jdom.*;
import org.jdom.input.*;
import org.jdom.output.*;
SAXBuilder builder = new SAXBuilder(false);
//得到Document
Document doc = builder.build(fileURI);
//名字空间
Namespace ns = Namespace.getNamespace("LIT" , "http://www.lit.edu.cn/student/ ");
//取得所有LIT:student节点的集合
List lstStudents = elmtStuInfo.getChildren("student",ns);
for ( … ){
Element elmtStudent = (Element)lstStudents.get(i);
elmtStudent.getChildTextTrim("name", ns);
}
//修改
elmtLesson.getChild("lessonScore" , ns).setText("100");
//删除
elmtStuInfo.removeChild("master", ns);
//添加
elmtStuInfo.addContent(new Element("master" , ns).addContent(new Entity("masterName")));
//输出文档
//第一个参数是缩进字符串,这里是4个空格。
//第二个参数是true,表示需要换行。
XMLOutputter printDoc = new XMLOutputter(" ", true);
printDoc.output(doc, new FileOutputStream("StuInfo.xml"));
4.JAXB (Java And XML Binding)
JAXB 是以SUN为主的一些公司公布的。JAXB将schema(或者DTD)映射为java对象(.java文件),然后使用这些java对象来解析xml文件。需要使用之前生成java文件,因而要有固定的schema,无法处理动态的xml文件。
首先使用xjc命令,生成java文件
xjc [-options ...]
(生成的文件较多)
JAXBContext jc = JAXBContext.newInstance(“packageName");
Unmarshaller unmarshaller = jc.createUnmarshaller();
Collection collection= (Collection)unmarshaller.unmarshal(new File( "books.xml"));
CollectionType.BooksType booksType =collection.getBooks();
List bookList = booksType.getBook();
for( … ){
test.jaxb.BookType book =(test.jaxb.BookType) bookList.get(i);
System.out.println("Book Name: " + book.getName().trim());
System.out.println("Book ISBN: " + book.getISBN());
}
补充另一种方法:
据悉dom4j在xml解析方面是性能最好的,hibernate等框架都使用它作为解析的工具。
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/
目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip
解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要加入包jaxen-1.1-beta-7.jar
写了简单的dom4j的使用的demo,以备回忆,有些是dom4j的文挡里例子改编的
使用dom4j解析下面的xml文件。
<?xml version="1.0" encoding="GB2312"?>
<?xml-stylesheet type="text/xsl" href="students.xsl"?>
<students>
<student sn="01">
<name>张三</name>
<age>18</age>
</student>
<student sn="02">
<name>李四</name>
<age>20</age>
</student>
</students>
Parse.java
import java.io.File;
import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.ProcessingInstruction;
import org.dom4j.VisitorSupport;
import org.dom4j.io.SAXReader;
public class Parse {
public static void main(String[] args) {
SAXReader reader = new SAXReader();
File file = new File("src/students.xml");
try {
Document doc = reader.read(file);
doc.accept(new MyVistor());
} catch (DocumentException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
public static class MyVistor extends VisitorSupport {
public void visit(Attribute node) {
System.out.println("Attibute:---" + node.getName() + "="+ node.getValue());
}
public void visit(Element node) {
if (node.isTextOnly()) {
System.out.println("Element:---" + node.getName() + "="
+ node.getText());
}else{
System.out.println("--------" + node.getName() + "-------");
}
}
@Override
public void visit(ProcessingInstruction node) {
System.out.println("PI:"+node.getTarget()+" "+node.getText());
}
}
}
使用dom4j来将属性写入xml
import java.io.FileWriter;
import java.io.IOException;
import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.XMLWriter;
public class DWriter {
public static void main(String[] args) {
// TODO Auto-generated method stub
try {
XMLWriter writer = new XMLWriter(new FileWriter("src/author.xml"));
Document doc = createDoc();
writer.write(doc);
writer.close();
// Pretty print the document to System.out
// 设置了打印的格式,将读出到控制台的格式进行美化
OutputFormat format = OutputFormat.createPrettyPrint();
writer = new XMLWriter(System.out, format);
writer.write(doc);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
public static Document createDoc() {
Document doc = DocumentHelper.createDocument();
Element root = doc.addElement("root");
Element author1 = root.addElement("author").addAttribute("name",
"Kree").addAttribute("location", "UK")
.addText("Kree Strachan");
Element author2 = root.addElement("author").addAttribute("name", "King")
.addAttribute("location", "US").addText("King McWrirter");
return doc;
}
}
使用dom4j写入到author.xml文件的内容
<?xml version="1.0" encoding="UTF-8"?>
<root>
<author name="Kree" location="UK">Kree Strachan</author>
<author name="King" location="US">King McWrirter</author>
</root>
相关推荐
在Java中,有多种库和技术用于解析XML文档,包括JDOM、JAXB、DOM4J、DOM、SAX和StaX。接下来我们将详细探讨这些解析方式。 1. JDOM JDOM是Java Document Object Model的简称,它为Java提供了本地化的XML API。JDOM...
本文将深入探讨两种主要的XML解析方法——SAX(Simple API for XML)和DOM(Document Object Model),并讲解如何使用它们来解析XML文件以及生成XML文件。 一、SAX解析XML SAX是一种事件驱动的解析器,它逐行扫描...
我们将讨论DOM、SAX、JDOM、DOM4J和JAXB这五种解析器,以及它们各自的特点和适用场景。 1. DOM(文档对象模型)解析: DOM解析器将整个XML文档加载到内存中,形成一个树形结构,允许开发者通过节点遍历访问XML数据...
8. **与JAXB和JDOM的比较**:dom4j相比JAXB(Java Architecture for XML Binding)和JDOM,提供了更丰富的API和功能,同时在某些场景下性能更优,但JAXB和JDOM在特定任务上(如Java对象和XML之间的自动绑定)可能更...
Jaxen可以与多种XML解析器(如DOM、DOM4J、JDOM等)协同工作,提供跨平台的XPath支持。 总结来说,DOM4J是一个全面且易用的XML处理工具,广泛应用于Java开发中。通过`dom4j-1.6.1.jar`和`jaxen-1.1.1.jar`这两个jar...
6. **集成其他技术**:DOM4J与许多其他Java库如JAXB(Java API for XML Binding)、JDOM、XOM等有良好的集成,可以方便地与其他XML处理技术配合使用。 7. **性能优化**:DOM4J在设计时考虑了性能,如使用缓存机制...
1. **解析XML**:DOM4J支持使用DOM、SAX或StAX解析器读取XML文件,其中DOM是将整个XML文档加载到内存中,适用于小型文件;SAX是事件驱动的解析,适用于大文件;而StAX则提供了一种更高效的方式,通过迭代器逐个处理...
5. **事件驱动解析(SAX)**:除了传统的DOM解析外,DOM4J还支持SAX解析器,这种解析方式适用于处理大型XML文件,因为它不需要一次性加载整个文档到内存。 6. **Namespace支持**:DOM4J提供了对XML命名空间的全面...
4. JDOM和DOM4J: 这两个库是对DOM API的增强,提供了更简洁的API,便于进行XML操作。例如,JDOM使用Java对象模型直接映射XML元素,而DOM4J则提供了灵活且强大的XML处理功能。 5. JAXB (Java Architecture for XML ...
XML(eXtensible Markup Language)是一种用于标记数据的语言,广泛应用在互联网上,尤其是在数据交换、配置文件和文档存储等...理解并熟练掌握DOM、SAX、StAX、JAXB和JDOM等解析方法,是每个Java开发者必备的技能。
DOM4J是Java中一个非常强大的XML处理库,它结合了DOM、SAX和JDOM的优点,同时也弥补了它们在某些方面的不足。 1. **DOM4J基本概念** - DOM4J是一种Java库,它为处理XML、XPath和XSLT提供了一种简单和高性能的方法...
首先,DOM解析是一种将整个XML文档加载到内存中的解析方式,它构建了一个树形结构,允许开发者通过节点层级遍历和操作XML文档。DOM解析器读取XML文件后,会创建一个完整的DOM树,每个元素、属性、文本等都有对应的...
SAX(Simple API for XML)是一种基于事件驱动的解析方式,不存储整个XML文档,而是逐行读取,当遇到特定元素时触发回调函数。这种解析方式内存占用低,适合处理大型XML文件。Java中的SAX解析器包括Java内置的SAX...
DOM4J不仅提供了DOM和SAX的接口,还支持XPath查询和XML Schema验证,甚至可以与JAXB(Java Architecture for XML Binding)一起使用,方便地将XML数据映射为Java对象。DOM4J的一个关键特性是其强大的文档建模能力,...
- 与JDOM相比,DOM4J提供了更多的功能,例如XPath支持和SAX解析。 - 虽然DOM4J不是JAXP(Java API for XML Processing)的一部分,但其兼容性良好,可与许多其他XML工具配合使用。 5. **应用场景** - Web服务:...
通过DOM,可以方便地对XML文档进行任意位置的读写操作,但DOM解析器对内存和CPU的需求较高,适用于小型XML文档。 2. SAX解析: SAX是一种事件驱动的解析方式,它逐行读取XML文档,当遇到元素开始、结束、属性等...
本文将深入探讨Java XML API中的核心组件,包括SAX(Simple API for XML)、DOM(Document Object Model)以及JAXB(Java Architecture for XML Binding),并讲解它们在XML处理中的应用。 1. SAX解析器 SAX是一种...
4. **事件驱动处理**:DOM4J支持SAX解析器的事件驱动模式,可以在解析过程中对XML事件进行处理,如开始元素、结束元素等。 5. **命名空间处理**:对于包含命名空间的XML文档,DOM4J提供了便捷的方法来处理和操作...
Java XML解析是Java编程中的一项...总之,Java XML解析是Java开发中的基础技能,掌握DOM、SAX和JAXB等解析方式对于处理XML数据至关重要。通过实践和学习提供的源代码,你将能够熟练地在Java项目中解析和操作XML文件。
DOM4J还支持SAX和DOM解析,并且与JDOM和JAXB等其他XML库兼容。 总的来说,通过学习这个视频教程,你将能够了解XML解析的基本概念,掌握DOM4J库的使用,从而在实际开发中更加高效地处理XML文档。无论你是Java开发者...