`
hn_archer
  • 浏览: 129983 次
  • 性别: Icon_minigender_1
  • 来自: 河南
社区版块
存档分类
最新评论

使用 dom4j 解析 XML

 
阅读更多

dom4j是一种解析XML文档的开放源代码的XML框架。从性能上来说,这个框架已经远远的超过了W3C DOM、JDOM了。而且,dom4j支持XPath。

   dom4j的API里面包含一个解析XML文档的工具,我们使用这个解析器创建一个示例XML文档,清单1.catalog.xml。然后使用同一个解析器修改catalog.xml,清单2是修改生的XML文档,catalog-modified.xml。

 

清单1.示例XML文档(catalog.xml)

<?xml version="1.0" encoding="UTF-8"?>
<catalog>
 <!--An XML Catalog-->
 <?target instruction?>
 <journal title="XML Zone" publisher="IBM developerWorks">
   <article level="Intermediate" date="December-2001">
     <title>Java configuration with XML Schema</title>
     <author>
       <firstname>Marcello</firstname>
       <lastname>Vitaletti</lastname>
     </author>
   </article>
 </journal>
</catalog>

 清单2.修改后的XML文档(catalog-modified.xml)

<?xml version="1.0" encoding="UTF-8"?>
<catalog>
<!--An XML catalog-->
<?target instruction?>
    <journal title="XML Zone" publisher="IBM developerWorks">
       <article level="Introductory" date="October-2002">
           <title>Create flexible and extensible XML schemas</title>
           <author>
              <firstname>Ayesha</firstname>
              <lastname>Malik</lastname>
           </author>
       </article>
    </journal>
</catalog>

1:使用DocumentHelper类创建一个文档实例。DocumentHelper是生成XML文档节点的dom4j API 工厂类。

Document document = DocumentHelper.createDocument();   

 

2:使用addElement()方法创建根元素catalog。addElement()用于向XML文档中啬元素。

Element catalogElement = document.addElement("catalog");

 

3:在catalog元素中使用addComment()方法添加注释“An XML catalog”。

catalogElement.addComment("An XML catalog");

 

4:在catalog元素中使用addProcessingInstruction()方法增加一个处理指令。

catalogElement.addProcessingInstruction("target","text");

 

5:在catalog元素中使用addElement()方法啬journal元素。

Element journalElement =  catalogElement.addElement("journal");

 

6:使用addAttribute()方法向journal元素添加title和publisher属性。

journalElement.addAttribute("title", "XML Zone");

journalElement.addAttribute("publisher", "IBM developerWorks");

 

7:向journal元素中添加article元素,并添加level和date属性。

Element articleElement=journalElement.addElement("article")

                       .addAttribute("level", "Intermediate")

                       .addAttribute("date", "December-2001");

 

8:向article元素中添加title元素,author元素。

Element titleElement=articleElement.addElement("title");
titleElement.setText("Java configuration with XML Schema");
       
Element authorElement=articleElement.addElement("author");
       
Element firstNameElement=authorElement.addElement("firstname");
firstNameElement.setText("Marcello");

Element lastNameElement=authorElement.addElement("lastname");
lastNameElement.setText("Vitaletti");

 

9:还可以用addDocType()方法向文件加入文档类型说明

document.addDocType("catalog",null,"file://c:/Dtds/catalog.dtd");

这样就会身XML文档中添加文档类型说明:

<!DOCTYPE catalog SYSTEM “file://c:/Dtds/catalog.dtd">

如果文档 要作用文档类型定义(DTD)文档验证则必须有Doctype。

 

10:把Document写入文件

try
{
  XMLWriter output = new XMLWriter(new FileWriter("e:/catalog.xml"));
  output.write(document);         
  output.close();
} catch (IOException e) {
  System.out.println(e.getMessage());
}

 

经过以上10个过程,我们创建了catalog.xml文档。下面我们把catalog.xml修改一下,并生成catalog-modified.xml。

 

1:使用 SAXReader 解析 XML 文档 catalog.xml:

SAXReader saxReader = new SAXReader();

Document documentOld = saxReader.read(new File("e:/catalog.xml"));

 

2:使用XPath表达式从article元素中获得level节点列表,如果level属性值是“Intermediate”则改为“Introductory”。

List list = documentOld.selectNodes("//article/@level" );
Iterator iter=list.iterator();
while(iter.hasNext()){
    Attribute attribute=(Attribute)iter.next();        
   
    if(attribute.getValue().equals("Intermediate"))
       attribute.setValue("Introductory");
}

 3:修改title

/*
 * 1:遍历所有article元素
 * 2:遍历article元素下的title元素
 * 3:比较修改
 */
list = document.selectNodes("//article");
iter = list.iterator();
while (iter.hasNext()) {
    Element element = (Element) iter.next();
    Iterator iterator = element.elementIterator("title");
    while (iterator.hasNext()) {
       Element titleElement1 = (Element) iterator.next();
       if (titleElement1.getText().equals(
              "Java configuration with XML Schema"))
           titleElement1
                  .setText("Create flexible and extensible XML schema");
    }
}

以过多次修改,得到catalog-modified.xml的Document对象,再写入文件!

 

从上面的例子,我们可以看出,dom4j里最常用的几个地方是:

 

1:枚举(Iterator)

// 枚举所有子节点
for ( Iterator i = root.elementIterator(); i.hasNext(); ) {
   Element element = (Element) i.next();
   // do something
}
// 枚举名称为foo的节点
for ( Iterator i = root.elementIterator("foo"); i.hasNext();) {
   Element foo = (Element) i.next();
   // do something
}
// 枚举属性
for ( Iterator i = root.attributeIterator(); i.hasNext(); ) {
   Attribute attribute = (Attribute) i.next();
   // do something
}

 2:递归

public void treeWalk(Element element) {
    for (int i = 0, size = element.nodeCount(); i < size; i++) {
       Node node = element.node(i);
       if (node instanceof Element) {
           treeWalk((Element) node);
       } else {
           // do something....
       }
    }
}

 

3:得到想要的节点的对象,对XPath的良好支持

public void bar(Document document) {
  List list = document.selectNodes("//foo/bar");
  Node node = document.selectSingleNode("//foo/bar/author");
  String name = node.valueOf("@name");
}

 例如,如果你想查找XHTML 文档中所有的超链接,下面的代码可以实现:

public void findLinks(Document document) throws
  DocumentException {
    List list = document.selectNodes( //a/@href );
    for (Iterator iter = list.iterator(); iter.hasNext(); ) {
      Attribute attribute = (Attribute) iter.next();
     String url = attribute.getValue();
    }
}

  

4:XML----String转换

// XML 转字符串
Document document = ...;
String text = document.asXML();
// 字符串转XML
String text = "<person><name>James</name></person>";
Document document = DocumentHelper.parseText(text);

  

下面的例子,是一个运用递归,复制文件的例子:

Dom4jDemo2 dom4jDemo = new Dom4jDemo2();
// ------------源---------------
SAXReader saxReader = new SAXReader();
Document docSource = saxReader.read(new File("e:\\jcmReponse.xml"));
Element rootSource = docSource.getRootElement();
 
// ------------目标-------------
Document docTarget = DocumentHelper.createDocument();
Element rootTarget = docTarget.addElement(rootSource.getNamespacePrefix()    +":"+rootSource.getName());
 
dom4jDemo.treeWalk(iteratorSource,return1);
dom4jDemo.writeNewXml(docTarget, "e:\\b.xml");
 
// 写入
public void writeNewXml(Document doc, String fileName) {
try {
    OutputFormat format = OutputFormat.createPrettyPrint();
    XMLWriter writer = new XMLWriter(new FileWriter(fileName), format);
    writer.write(doc);
    writer.close();
} catch (IOException e) {
    e.printStackTrace();
  }
}
 
// 递归
private void treeWalk(Element element, Element targetE) {
    for (int i = 0, size = element.nodeCount(); i < size; i++) {
       Node node = element.node(i);
       Element eTemp = null;
       if (node instanceof Element) {           
          
           String nameSpacePrefix = ((Element) node).getNamespacePrefix();
           if(nameSpacePrefix == null || "".equals(nameSpacePrefix))
              eTemp = targetE.addElement(node.getName());
           else
              eTemp = targetE.addElement(nameSpacePrefix + ":"+ node.getName());
 
           eTemp.setText(node.getText());
 
           for (Iterator ite = ((Element) node).attributeIterator(); ite.hasNext();) {
              Attribute atr = (Attribute) ite.next();
              eTemp.addAttribute(atr.getNamespacePrefix() + ":"
                     + atr.getName(), atr.getValue());
           }
           treeWalk((Element) node, eTemp);
       }
    }
}

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics