jacktan123

浏览: 42912 次
性别:
来自: 深圳

最近访客更多访客>>

wangyy

chenruieye

jstl1point0

eman

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Java读写Xml

博客分类：

Java

dom4j xml

Xml

eXtendsible markup language 可扩展的标记语言

XML 有什么用?

可以用来保存数据
可以用来做配置文件
数据传输载体

定义xml

其实就是一个文件，文件的后缀为 .xml

. 文档声明

    简单声明， version : 解析这个xml的时候，使用什么版本的解析器解析
    <?xml version="1.0" ?>

    encoding : 解析xml中的文字的时候，使用什么编码来翻译
    <?xml version="1.0" encoding="gbk" ?>

    standalone  : no - 该文档会依赖关联其他文档 ，  yes-- 这是一个独立的文档
    <?xml version="1.0" encoding="gbk" standalone="no" ?>

encoding详解

在解析这个xml的时候，使用什么编码去解析。 —-解码。

 文字， 而是存储这些文字对应的二进制 。 那么这些文字对应的二进制到底是多少呢？ 根据文件使用的编码 来得到。

默认文件保存的时候，使用的是GBK的编码保存。

所以要想让我们的xml能够正常的显示中文，有两种解决办法

让encoding也是GBK 或者 gb2312 .
如果encoding是 utf-8 ，那么保存文件的时候也必须使用utf-8
保存的时候见到的ANSI 对应的其实是我们的本地编码 GBK。

为了通用，建议使用UTF-8编码保存，以及encoding 都是 utf-8

元素定义（标签）

其实就是里面的标签， <> 括起来的都叫元素。成对出现。如下：
```
<stu> </stu>
```
文档声明下来的第一个元素叫做根元素 (根标签)
标签里面可以嵌套标签

空标签

既是开始也是结束。 一般配合属性来用。

<age/>

    <stu>
        <name>张三</name>
        <age/>
    </stu>

标签可以自定义。

XML 命名规则

XML 元素必须遵循以下命名规则：

名称可以含字母、数字以及其他的字符 
名称不能以数字或者标点符号开始 
名称不能以字符 “xml”（或者 XML、Xml）开始 
名称不能包含空格

命名尽量简单，做到见名知义

简单元素 & 复杂元素

简单元素

元素里面包含了普通的文字

复杂元素

元素里面还可以嵌套其他的元素

属性的定义

定义在元素里面， <元素名称属性名称=”属性的值”></元素名称>

张三
18
李四
28

xml注释：

与html的注释一样。

<!-- --> 
如： 

    <?xml version="1.0" encoding="UTF-8"?>
    <!-- 
        //这里有两个学生
        //一个学生，名字叫张三， 年龄18岁， 学号：10086
        //另外一个学生叫李四  。。。
     -->

xml的注释，不允许放置在文档的第一行。必须在文档声明的下面。

CDATA区

非法字符

严格地讲，在 XML 中仅有字符 “<”和”&” 是非法的。省略号、引号和大于号是合法的，但是把它们替换为实体引用是个好的习惯。

< <
& &

如果某段字符串里面有过多的字符，并且里面包含了类似标签或者关键字的这种文字，不想让xml的解析器去解析。那么可以使用CDATA来包装。不过这个CDATA 一般比较少看到。通常在服务器给客户端返回数据的时候。

<des><![CDATA[<a href="http://www.baidu.com">我爱黑马训练营</a>]]></des>

XML 解析

其实就是获取元素里面的字符数据或者属性数据。

XML解析方式(面试常问)

有很多种，但是常用的有两种。

针对这两种解析方式的API

一些组织或者公司，针对以上两种解析方式，给出的解决方案有哪些？

    jaxp  sun公司。 比较繁琐

    jdom
    dom4j  使用比较广泛

Dom4j 基本读写用法

创建SaxReader对象
指定解析的xml
获取根元素。
根据根元素获取子元素或者下面的子孙元素

public class XmlParser
{
	public static void main(String[] args)
	{
		try
		{
			// DOM4J读xml
			SAXReader reader = new SAXReader();
			Document document = reader.read(new File("src/students.xml"));
			// 1.获取根节点
			Element element = document.getRootElement();
			// 2.获取根节点下的指定的元素
			Element userElement = element.element("user");
			// 3.获取当前元素的属性
			String str = userElement.attributeValue("id");
			// 4.获取当前元素的所有属性
			List userAttrList = userElement.attributes();
			// 5.获取当前下所有的子元素
			List<Element> elementList = element.elements();
			// 6.获取当前元素下子元素的值
			String emailStr = userElement.element("email").getText();

			// 7.删除某属性
			Attribute attribute = element.attribute("size");// 属性名name
			//document.remove(attribute);

			// 8.添加节点的属性和文字.
			element.addAttribute("name", "sitinspring");

			System.out.println(emailStr);

			// 将文档写入XML文件.
			// 1.文档中全为英文,不设置编码,直接写入的形式.
			XMLWriter writer = new XMLWriter(new FileWriter("output.xml"));
			writer.write(document);
			writer.close();
			// 2.文档中含有中文,设置编码格式写入的形式
			OutputFormat format = OutputFormat.createPrettyPrint();
			format.setEncoding("GBK");//指定XML编码
			writer = new XMLWriter(new FileWriter("output.xml"), format);
			writer.write(document);
			writer.close();
			// XPath方式读取指定的节点
		} catch (DocumentException e)
		{
			e.printStackTrace();
		} catch (IOException e)
		{
			e.printStackTrace();
		}

	}
}

SaxReader 创建好对象。

Document
Element

看文档
记住关键字。
有对象先点一下。
看一下方法的返回值。
根据平时的积累。 getXXX setXXX

Dom4j 的 Xpath使用

dom4j里面支持Xpath的写法。 xpath其实是xml的路径语言，支持我们在解析xml的时候，能够快速的定位到具体的某一个元素。

添加jar包依赖

jaxen-1.1-beta-6.jar
在查找指定节点的时候，根据XPath语法规则来查找
后续的代码与以前的解析代码一样。

        //要想使用Xpath， 还得添加支持的jar 获取的是第一个 只返回一个。 
        Element nameElement = (Element) rootElement.selectSingleNode("//name");
        System.out.println(nameElement.getText());


        System.out.println("----------------");

        //获取文档里面的所有name元素 
        List<Element> list = rootElement.selectNodes("//name");
        for (Element element : list) {
            System.out.println(element.getText());
        }

XML 约束【了解】

如下的文档，属性的ID值是一样的。这在生活中是不可能出现的。并且第二个学生的姓名有好几个。一般也很少。那么怎么规定ID的值唯一，或者是元素只能出现一次，不能出现多次？甚至是规定里面只能出现具体的元素名字。

    <stus>
        <stu id="10086">
            <name>张三</name>
            <age>18</age>
            <address>深圳</address>
        </stu>
        <stu id="10086">
            <name>李四</name>
            <name>李五</name>
            <name>李六</name>
            <age>28</age>
            <address>北京</address>
        </stu>
    </stus>

DTD

语法自成一派， 早起就出现的。 可读性比较差。

引入网络上的DTD

<!-- 引入dtd 来约束这个xml -->

<!--    文档类型  根标签名字 网络上的dtd   dtd的名称   dtd的路径
<!DOCTYPE stus PUBLIC "//UNKNOWN/" "unknown.dtd"> -->

引入本地的DTD

直接在XML里面嵌入DTD的约束规则

<!-- xml文档里面直接嵌入DTD的约束法则 -->
<!DOCTYPE stus [
    <!ELEMENT stus (stu)>
    <!ELEMENT stu (name,age)>
    <!ELEMENT name (#PCDATA)>
    <!ELEMENT age (#PCDATA)>
]>

<stus>
    <stu>
        <name>张三</name>
        <age>18</age>
    </stu>
</stus>

    <!ELEMENT stus (stu)>  : stus 下面有一个元素 stu  ， 但是只有一个
    <!ELEMENT stu (name , age)>  stu下面有两个元素 name  ,age  顺序必须name-age
    <!ELEMENT name (#PCDATA)> 
    <!ELEMENT age (#PCDATA)>
    <!ATTLIST stu id CDATA #IMPLIED> stu有一个属性 文本类型， 该属性可有可无


    元素的个数：

        ＋　一个或多个
        *  零个或多个
        ? 零个或一个

    属性的类型定义 

        CDATA : 属性是普通文字
        ID : 属性的值必须唯一


    <!ELEMENT stu (name , age)>        按照顺序来 

    <!ELEMENT stu (name | age)>   两个中只能包含一个子元素

Schema

其实就是一个xml ， 使用xml的语法规则， xml解析器解析起来比较方便 ， 是为了替代DTD 。
但是Schema 约束文本内容比DTD的内容还要多。 所以目前也没有真正意义上的替代DTD


约束文档：
    <!-- xmlns  :  xml namespace : 名称空间 /  命名空间
    targetNamespace :  目标名称空间 。 下面定义的那些元素都与这个名称空间绑定上。 
    elementFormDefault ： 元素的格式化情况。  -->
    <schema xmlns="http://www.w3.org/2001/XMLSchema" 
        targetNamespace="http://www.itheima.com/teacher" 
        elementFormDefault="qualified">

        <element name="teachers">
            <complexType>
                <sequence maxOccurs="unbounded">
                    <!-- 这是一个复杂元素 -->
                    <element name="teacher">
                        <complexType>
                            <sequence>
                                <!-- 以下两个是简单元素 -->
                                <element name="name" type="string"></element>
                                <element name="age" type="int"></element>
                            </sequence>
                        </complexType>
                    </element>
                </sequence>
            </complexType>
        </element>
    </schema>

实例文档：
    <?xml version="1.0" encoding="UTF-8"?>
    <!-- xmlns:xsi : 这里必须是这样的写法，也就是这个值已经固定了。
    xmlns : 这里是名称空间，也固定了，写的是schema里面的顶部目标名称空间
    xsi:schemaLocation : 有两段： 前半段是名称空间，也是目标空间的值 ， 后面是约束文档的路径。
     -->
    <teachers
        xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
        xmlns="http://www.itheima.com/teacher"
        xsi:schemaLocation="http://www.itheima.com/teacher teacher.xsd"
    >
        <teacher>
            <name>zhangsan</name>
            <age>19</age>
        </teacher>
        <teacher>
            <name>lisi</name>
            <age>29</age>
        </teacher>
        <teacher>
            <name>lisi</name>
            <age>29</age>
        </teacher>
    </teachers>

名称空间的作用

一个xml如果想指定它的约束规则，假设使用的是DTD ，那么这个xml只能指定一个DTD ，不能指定多个DTD 。但是如果一个xml的约束是定义在schema里面，并且是多个schema，那么是可以的。简单的说：一个xml 可以引用多个schema约束。但是只能引用一个DTD约束。

名称空间的作用就是在写元素的时候，可以指定该元素使用的是哪一套约束规则。默认情况下，如果只有一套规则，那么都可以这么写

<name>张三</name>

<aa:name></aa:name>
<bb:name></bb:name>

dom4j-1.6.1.jar (306.5 KB)
下载次数: 2

jaxen-1.1-beta-6.jar (238.6 KB)
下载次数: 0

分享到：

Sublime Text解决输入中文问题 | Java基础

2018-10-01 01:19
浏览 512
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Java读写Xml

Xml

XML 有什么用?

定义xml

. 文档声明

encoding详解

元素定义（标签）

简单元素 & 复杂元素

属性的定义

xml注释：

CDATA区

XML 解析

XML解析方式(面试常问)

针对这两种解析方式的API

Dom4j 基本读写用法

Dom4j 的 Xpath使用

XML 约束【了解】

DTD

Schema

名称空间的作用

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Java读写Xml

Xml

XML 有什么用?

定义xml

. 文档声明

encoding详解

元素定义（标签）

简单元素 & 复杂元素

属性的定义

xml注释：

CDATA区

XML 解析

XML解析方式(面试常问)

针对这两种解析方式的API

Dom4j 基本读写用法

Dom4j 的 Xpath使用

XML 约束【了解】

DTD

Schema

名称空间的作用

评论

发表评论

相关推荐

Java -D命令对应的代码中获取

全角转半角字符

Java 对象转换为 JSON 格式

关于java.lang.NoClassDefFoundError: org/apache/commons/collections/FastHashMap的错误解

Java基础

java socket聊天室

Java比较同类的对象的不同字段的值

java_解压tar.z文件包（*.tar、*.z）

对象逆序列化报错：java.lang.ClassNotFoundException

获取一个Jpanel的父容器

精简jre包

Java执行Jar

java的帮助网址

jexl 执行字符串表达式

打开文件及文件夹

aliyun阿里云Maven仓库地址——加速你的maven构建

最近访客更多访客>>

java_解压tar.z文件包（.tar、.z）