- 浏览: 458454 次
- 性别:
- 来自: 杭州
文章分类
最新评论
-
syw19901001:
30多条mysql数据库优化方法,千万级数据库记录查询轻松解决 ...
MYSQL的全表扫描,主键索引(聚集索引、第一索引),非主键索引(非聚集索引、第二索引),覆盖索引四种不同查询的分析 -
gaoyuanyuan121:
直接改成root.war,根路径能访问,项目路径也能访问,赞 ...
jetty 中如何设置root app -
freezingsky:
翻出来,再看一次!
AOP 的简单入门 -
Shen.Yiyang:
inter12 写道Shen.Yiyang 写道我说的不是NI ...
ReentrantLock、sync、ReentrantReadWriteLock性能比较 -
inter12:
Shen.Yiyang 写道我说的不是NIO和BIO的区别,而 ...
ReentrantLock、sync、ReentrantReadWriteLock性能比较
java sax 解析
JAVA 解析 XML 通常有两种方式:DOM 和SAX。DOM(文档对象模型)是W3C标准,提供了标准的解析方式,但其解析效率一直不尽如人意,这是因为DOM解析XML文档时,把所有内容一次性的装载入内存,并构建一个驻留在内存中的树状结构(节点数)。如果需要解析的XML文档过大,或者我们只对该文档中的一部分感兴趣,这样就会引起性能问题。
SAX(simple API for XML)是一种XML解析的替代方法。相比于DOM,SAX是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。而且相比于DOM,SAX可以在解析文档的任意时刻停止解析,但任何事物都有其相反的一面,对于SAX来说就是操作复杂
SAX的工作原理
SAX,它既是一个接口,也是一个软件包.但作为接口,SAX是事件驱动型XML解析的一个标准接口不会改变 SAX的工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束、文档(document)结束等地方时通知事件处理函数,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。
大多数SAX都会产生以下类型的事件:
1.在文档的开始和结束时触发文档处理事件。
2.在文档内每一XML元素接受解析的前后触发元素事件。
3.任何元数据通常由单独的事件处理
4.在处理文档的DTD或Schema时产生DTD或Schema事件。
5.产生错误事件用来通知主机应用程序解析错误。
SAX解析文档过程举例
对于一个XML文档举例来说
<doc>
<para>Hello,World!</para>
</doc>
其解析的过程为:
1.start document
2.start element:doc......
3.start element:para.....
4.characters:Hello,World!
5.end element:para......
6.end element;doc......
7.end document
对于解析过程中的每一步都会有事件发生,都会触发相应接口中的事件处理程序。
编写程序的步骤为:
(1).创建事件处理程序(也就是编写ContentHandler的实现类,一般继承自DefaultHandler类,采用adapter模式)
(2).创建SAX解析器
(3).将事件处理程序分配到解析器
(4).对文档进行解析,将每个事件发送给事件处理程序
SAX接口介绍
ContentHandler接口 (主要用到的接口)
ContentHandler是Java类包中一个特殊的SAX接口,位于org.xml.sax包中。该接口封装了一些对事件处理的方法,当XML解析器开始解析XML输入文档时,它会遇到某些特殊的事件,比如文档的开头和结束、元素开头和结束、以及元素中的字符数据等事件。当遇到这些事件时,XML解析器会调用ContentHandler接口中相应的方法来响应该事件。
ContentHandler接口的方法有以下几种:
void startDocument() //文档解析开始的处理
void endDocument() //文档解析结束的处理
void startElement(String uri, String localName, String qName, Attributes atts) //ElementNode开始的处理
void endElement(String uri, String localName, String qName) //ElementNode结束的处理
void characters(char[ ] ch, int start, int length) //具体在某一节点中的处理
DTDHandler接口
DTDHandler用于接收基本的DTD相关事件的通知。该接口位于org.xml.sax包中。此接口仅包括DTD事件的注释和未解析的实体声明部分。SAX解析器可按任何顺序报告这些事件,而不管声明注释和未解析实体时所采用的顺序;但是,必须在文档处理程序的startDocument()事件之后,在第一个startElement()事件之前报告所有的DTD事件。
DTDHandler接口包括以下两个方法
void startDocumevoid notationDecl(String name, String publicId, String systemId) nt()
void unparsedEntityDecl(String name, String publicId, String systemId, String notationName)
EntityResolver接口
EntityResolver接口是用于解析实体的基本接口,该接口位于org.xml.sax包中。
该接口只有一个方法,如下:
public InputSource resolveEntity(String publicId, String systemId)
解析器将在打开任何外部实体前调用此方法。此类实体包括在DTD内引用的外部DTD子集和外部参数实体和在文档元素内引用的外部通用实体等。如果SAX应用程序需要实现自定义处理外部实体,则必须实现此接口。
ErrorHandler接口
ErrorHandler接口是SAX错误处理程序的基本接口。如果SAX应用程序需要实现自定义的错误处理,则它必须实现此接口,然后解析器将通过此接口报告所有的错误和警告。
该接口的方法如下:
void error(SAXParseException exception) //不同级别的处理方式
void fatalError(SAXParseException exception)
void warning(SAXParseException exception)
一个简单例子:
xml文档:
我们需要一个文档处理的类,一般需要继承之 contentHandler
现在还需要一个客户端的调用类:
XMLReader提供了两种方式的解析 :
传入的为输入流:
传入的为一个URI:本案例采用的就是这样方式
JAVA 解析 XML 通常有两种方式:DOM 和SAX。DOM(文档对象模型)是W3C标准,提供了标准的解析方式,但其解析效率一直不尽如人意,这是因为DOM解析XML文档时,把所有内容一次性的装载入内存,并构建一个驻留在内存中的树状结构(节点数)。如果需要解析的XML文档过大,或者我们只对该文档中的一部分感兴趣,这样就会引起性能问题。
SAX(simple API for XML)是一种XML解析的替代方法。相比于DOM,SAX是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。而且相比于DOM,SAX可以在解析文档的任意时刻停止解析,但任何事物都有其相反的一面,对于SAX来说就是操作复杂
SAX的工作原理
SAX,它既是一个接口,也是一个软件包.但作为接口,SAX是事件驱动型XML解析的一个标准接口不会改变 SAX的工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束、元素(element)开始与结束、文档(document)结束等地方时通知事件处理函数,由事件处理函数做相应动作,然后继续同样的扫描,直至文档结束。
大多数SAX都会产生以下类型的事件:
1.在文档的开始和结束时触发文档处理事件。
2.在文档内每一XML元素接受解析的前后触发元素事件。
3.任何元数据通常由单独的事件处理
4.在处理文档的DTD或Schema时产生DTD或Schema事件。
5.产生错误事件用来通知主机应用程序解析错误。
SAX解析文档过程举例
对于一个XML文档举例来说
<doc>
<para>Hello,World!</para>
</doc>
其解析的过程为:
1.start document
2.start element:doc......
3.start element:para.....
4.characters:Hello,World!
5.end element:para......
6.end element;doc......
7.end document
对于解析过程中的每一步都会有事件发生,都会触发相应接口中的事件处理程序。
编写程序的步骤为:
(1).创建事件处理程序(也就是编写ContentHandler的实现类,一般继承自DefaultHandler类,采用adapter模式)
(2).创建SAX解析器
(3).将事件处理程序分配到解析器
(4).对文档进行解析,将每个事件发送给事件处理程序
SAX接口介绍
ContentHandler接口 (主要用到的接口)
ContentHandler是Java类包中一个特殊的SAX接口,位于org.xml.sax包中。该接口封装了一些对事件处理的方法,当XML解析器开始解析XML输入文档时,它会遇到某些特殊的事件,比如文档的开头和结束、元素开头和结束、以及元素中的字符数据等事件。当遇到这些事件时,XML解析器会调用ContentHandler接口中相应的方法来响应该事件。
ContentHandler接口的方法有以下几种:
void startDocument() //文档解析开始的处理
void endDocument() //文档解析结束的处理
void startElement(String uri, String localName, String qName, Attributes atts) //ElementNode开始的处理
void endElement(String uri, String localName, String qName) //ElementNode结束的处理
void characters(char[ ] ch, int start, int length) //具体在某一节点中的处理
DTDHandler接口
DTDHandler用于接收基本的DTD相关事件的通知。该接口位于org.xml.sax包中。此接口仅包括DTD事件的注释和未解析的实体声明部分。SAX解析器可按任何顺序报告这些事件,而不管声明注释和未解析实体时所采用的顺序;但是,必须在文档处理程序的startDocument()事件之后,在第一个startElement()事件之前报告所有的DTD事件。
DTDHandler接口包括以下两个方法
void startDocumevoid notationDecl(String name, String publicId, String systemId) nt()
void unparsedEntityDecl(String name, String publicId, String systemId, String notationName)
EntityResolver接口
EntityResolver接口是用于解析实体的基本接口,该接口位于org.xml.sax包中。
该接口只有一个方法,如下:
public InputSource resolveEntity(String publicId, String systemId)
解析器将在打开任何外部实体前调用此方法。此类实体包括在DTD内引用的外部DTD子集和外部参数实体和在文档元素内引用的外部通用实体等。如果SAX应用程序需要实现自定义处理外部实体,则必须实现此接口。
ErrorHandler接口
ErrorHandler接口是SAX错误处理程序的基本接口。如果SAX应用程序需要实现自定义的错误处理,则它必须实现此接口,然后解析器将通过此接口报告所有的错误和警告。
该接口的方法如下:
void error(SAXParseException exception) //不同级别的处理方式
void fatalError(SAXParseException exception)
void warning(SAXParseException exception)
一个简单例子:
xml文档:
<?xml version="1.0"?> <books> <book id="11"> <name>effective java</name> <price>100.3</price> </book> <book id="12"> <name>javaScript</name> <price>39.3</price> </book> </books>
我们需要一个文档处理的类,一般需要继承之 contentHandler
package com.ming.util.saxparse; import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; public class MyContentHandler extends DefaultHandler { private String preName = null; // 当前节点元素的名字 private final String NAME = "name"; private final String PRICE = "prcie"; private final String BOOK = "book"; @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { if (qName.equals(BOOK)) { // doto 具体对名字的业务处理,这里我只是简单的进行输出 System.out.println( BOOK+ ":" + attributes.getQName(0)+" value:"+attributes.getValue(0)); } preName = qName;//标记当前的标签名字 } @Override public void endElement(String uri, String localName, String qName) throws SAXException { preName = null;// 一次处理完后重置标签名 } @Override public void characters(char[] ch, int start, int length) throws SAXException { if (null != preName) { String temp = new String(ch, start, length); if (preName.equals(NAME)) { // doto 具体对名字的业务处理,这里我只是简单的进行输出 System.out.println(NAME + ":" + temp); } else if (preName.equals(PRICE)) { System.out.println(PRICE + ":" + temp); } } } }
现在还需要一个客户端的调用类:
package com.ming.util.saxparse; import java.io.IOException; import org.xml.sax.SAXException; import org.xml.sax.XMLReader; import org.xml.sax.helpers.XMLReaderFactory; public class MySaxParse { public static void main(String[] args) throws SAXException, IOException { MyContentHandler myHandler = new MyContentHandler(); XMLReader reader = XMLReaderFactory.createXMLReader(); reader.setContentHandler(myHandler); //reader.setErrorHandler(myHandler); //错误的处理器 reader.parse("/home/inter12/Templates/test.xml"); } }
XMLReader提供了两种方式的解析 :
传入的为输入流:
public void parse (InputSource input) throws IOException, SAXException;
传入的为一个URI:本案例采用的就是这样方式
public void parse (String systemId) throws IOException, SAXException;
发表评论
-
if语句的写法之普通,文艺,2B青年写法
2011-12-08 21:21 1936最近这段时间在处理一个项目迁移,结果有大量的时间在写迁移代码。 ... -
Java.lang.reflect 包下常用的类及方法简介
2011-12-01 18:50 4127Class类之主要方法简介 Class<?&g ... -
Collections.EMPTY_LIST和Collections.emptyList()简单使用体会
2011-04-29 10:57 50971.背景 在某些情况下, ... -
多线程笔记--2
2010-07-30 17:19 107511, 在没有同步的情况下 , 编译器与处理器运行时的指令执行 ... -
JDK学习--java.util.concurrent.ConcurrentMap输出及输入
2010-07-30 17:14 2623新的 java.util.concurrent.Concurr ... -
JDK学习--java.util.concurrent阻塞队列--1
2010-07-30 17:12 997PriorityBlockingQueue 是具有无界限容量的 ... -
JDK学习--java.util.concurrent阻塞队列--1
2010-07-30 17:11 1177PriorityBlockingQueue 是具有无界限容量的 ... -
JDK学习--java.util.concurrent阻塞队列--1
2010-07-30 17:10 2056Tiger提供的 java.util.concurrent 包 ... -
socket基本通信
2010-07-28 22:33 31821.服务端 while(true){ ... -
java.util.zip
2010-07-19 16:49 1350主要是三个类: ZipOutputStream ... -
java.util.LinkedHashMap (2)
2010-07-19 16:43 1353step 1:建立对象。采用最少访问次数排序。 ... -
java.util.LinkedHashMap (1)
2010-07-19 16:42 3042LinkedHashMap :具有可预知的迭代顺序。区别与Ha ... -
java比较器的两种实现
2010-07-19 14:48 18151 实现一个Comparator 接口 public cl ... -
java.util.IdentityHashMap
2010-07-19 14:47 1705Map<Object, String> map = ... -
java.util.Arrays
2010-07-19 14:47 1297一些基本常用的方法: 一. 数组中的查找: ... -
apache 处理目录
2010-07-19 10:22 985private static class MyWalk ... -
一些core java知识
2010-07-19 10:05 10711. 对于url中需要转化的# %符号,可以采用base64编 ... -
xstream基本使用
2010-07-19 10:03 1379一个配置文件 <?xml version ... -
java基本概念--对象序列化及反序列化
2010-07-19 09:43 1545序列化(一): readResolve()方法与序列化 在CJ ... -
java基本概念--集合选择
2010-07-19 09:38 1047Arrays和Collections类的设 ...
相关推荐
下面将详细介绍Java SAX解析XML的相关知识点。 1. **SAX解析原理**: - SAX解析器读取XML文件,遇到每个元素、属性、文本等,都会触发一个相应的事件。 - 应用程序通过实现SAX解析器的回调接口,定义处理这些事件...
**JAVA SAX解析XML** 在Java编程中,XML(Extensible Markup Language)是一种广泛使用的数据交换格式,用于存储和传输结构化数据。为了处理XML文档,Java提供了两种主要的解析方式:DOM(Document Object Model)...
本示例将详细解释如何在Java中使用SAX解析XML文档,并通过注释进行详细说明。 首先,我们需要引入SAX解析器的依赖库,通常这可以通过在项目构建配置中添加JAXB或Xerces实现来实现。 ```java // 引入必要的库,如...
以下是一个简单的SAX解析XML的Java示例: ```java import org.xml.sax.XMLReader; import org.xml.sax.InputSource; import org.xml.sax.helpers.DefaultHandler; public class SaxDemo { public static void ...
Java解析XML数据主要涉及到...总的来说,SAX解析器是Java处理XML文档的一种高效方式,特别适合处理大文件或资源有限的情况。通过自定义事件处理器,我们可以灵活地解析XML文档中的特定信息,而不必一次性加载整个文档。
本文将深入探讨如何使用SAX解析XML并获取元素的值或内容。 首先,SAX解析器以流式方式读取XML文档,当遇到文档的不同部分时,会触发相应的事件,如开始文档、开始元素、结束元素等。开发者可以注册事件处理器来响应...
SAX解析XML文件的实例。一个项目同时用dom解析和sax解析xml文件貌似会报错,项目框架建一直是用sax和dom4j解析xml文件的。当我用dom解析xml文件。导入包后就报错识别不了xml文件的编码格式。于是做了一个sax解析xml...
在JSP中,我们可以使用Java的API来实现DOM和SAX解析: - 对于DOM解析,可以使用javax.xml.parsers.DocumentBuilderFactory和org.w3c.dom.Document接口。首先创建一个DocumentBuilderFactory实例,然后通过它获取...
SAX解析器以流式的方式读取XML文档,当遇到文档的各个元素时,会触发相应的事件,如开始文档、开始元素、结束元素、字符数据等。程序员通过实现SAX解析器的回调接口来处理这些事件,从而解析XML内容。这种方式使得...
Java中的SAX解析方案是一种高效的XML处理方法,尤其适用于大体积的XML文件。SAX(Simple API for XML)是基于事件驱动的解析器,它不会像DOM解析那样将整个XML文档加载到内存中,而是逐行读取并触发相应的事件处理器...
在本项目中,"saxloadxml"应该是实现了一个SAX解析XML文件的示例,旨在帮助开发者理解和应用SAX解析。 首先,我们需要理解SAX解析的基本原理。当解析器读取XML文件时,它会触发一系列的事件,如开始文档、结束文档...
然后,我们需要创建一个SAX解析器。Java的标准库提供`org.xml.sax.XMLReader`接口,但通常我们通过`org.xml.sax.helpers.XMLReaderFactory`来创建它的实例。为了处理XML事件,我们需要实现`org.xml.sax....
标签中的"java_sax"和"sax_xml"强调了这是关于Java语言中的SAX解析器和XML处理的资料。"java_sax_download"表明这些程序可以被下载,供开发者参考和学习。 压缩包内的文件名列表揭示了这些程序的具体功能: 1. **...
4. **创建SAX解析器**:使用`SAXParserFactory`的`newInstance()`方法创建一个解析器工厂,然后调用`newSAXParser()`方法生成SAX解析器实例。 5. **实现ContentHandler**:创建一个实现了`org.xml.sax....
SAX解析器的工作原理是基于事件驱动的,它在解析XML文档时会触发一系列的事件,如开始文档、结束文档、开始元素、结束元素等。开发者通过实现SAX解析器的回调接口(如ContentHandler),在这些事件发生时执行相应的...
相比之下,SAX解析器采用事件驱动模型,逐行读取XML文档,遇到元素、属性等结构时触发相应的事件。这种方法不将整个文档加载到内存,因此更适用于处理大型或内存受限的环境。然而,由于SAX是基于事件的,它不提供...
标题中提到的"XML通过SAX解析为JSON格式"是指使用SAX解析器来读取XML文档,并将其转换成等效的JSON对象。SAX解析器以流式方式处理XML,当遇到文档的不同部分(如开始标签、结束标签、文本节点等)时,会触发相应的...
以下是一个简单的SAX解析超大XML文件的Java示例代码: ```java import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; import javax.xml.parsers....
本实例“JAVA100例之实例69 JAVA使用SAX解析XML”将详细讲解如何利用SAX解析XML文件。SAX解析器通过触发一系列的回调事件来处理XML文档,程序员需要定义一个实现了`org.xml.sax.helpers.DefaultHandler`接口的类,...
标题"读取RSS-SAX解析XML实例(java版)"所涉及的知识点主要集中在两个方面:一是如何读取RSS(Really Simple Syndication)数据,二是使用SAX解析XML文件。 RSS是一种用于发布新闻、博客和其他定期更新内容的格式...