首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 网站开发 > XML SOAP >

Dom4j创办修改格式化解析XML文件及中文处理(转)

2012-11-10 
Dom4j创建修改格式化解析XML文件及中文处理(转)本文主要讨论了用dom4j解析XML的基础问题,包括建立XML文档,

Dom4j创建修改格式化解析XML文件及中文处理(转)

本文主要讨论了用dom4j解析XML的基础问题,包括建立XML文档,添加、修改、删除节点,以及格式化(美化)输出和中文问题。可作为dom4j的入门资料。

1. 下载与安装

dom4j是sourceforge.net上的一个开源项目,主要用于对XML的解析。从2001年7月发布第一版以来,已陆续推出多个版本,目前最高版本为1.5。
dom4j专门针对Java开发,使用起来非常简单、直观,在Java界,dom4j正迅速普及。

可以到http://sourceforge.net/projects/dom4j下载其最新版。

dom4j1.5的完整版大约13M,是一个名为dom4j-1.5.zip的压缩包,解压后有一个dom4j-1.5.jar文件,这就是应用时需要引入的类包,另外还有一个jaxen-1.1-beta-4.jar文件,一般也需要引入,否则执行时可能抛java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常,其他的包可以选择用之。

2. 示例XML文档(holen.xml)

为了述说方便,先看一个XML文档,之后的操作均以此文档为基础。

<books>
? ? <!--This is a test for dom4j, holen, 2004.9.11-->
? ? <book show="yes">
? ?? ? <title>Dom4j Tutorials</title>
? ? </book>
? ? <book show="yes">
? ?? ? <title>Lucene Studing</title>
? ? </book>
? ? <book show="no">
? ?? ? <title>Lucene in Action</title>
? ? </book>
? ? <owner>O'Reilly</owner>
</books>

这是一个很简单的XML文档,场景是一个网上书店,有很多书,每本书有两个属性,一个是书名[title],一个为是否展示[show],最后还有一项是这些书的拥有者[owner]信息。

3. 建立一个XML文档

<books><!--This is a test for dom4j, holen, 2004.9.11--><book show="yes"><title>Dom4j Tutorials</title></book><book show="yes"><title>Lucene Studing</title></book><book show="no"><title>Lucene in Action</title></book><owner>O'Reilly</owner></books>

4. 修改XML文档

有三项修改任务,依次为:
l? ?? ?? ?如果book节点中show属性的内容为yes,则修改成no
l? ?? ?? ?把owner项内容改为Tshinghua,并添加date节点
l? ?? ?? ?若title内容为Dom4j Tutorials,则删除该节点

? ?? ?? ???Iterator iter = list.iterator();
? ?? ?? ???while(iter.hasNext()){
? ?? ?? ?? ???Attribute attribute = (Attribute)iter.next();
? ?? ?? ?? ???if(attribute.getValue().equals("yes")){
? ?? ?? ?? ?? ?? ?attribute.setValue("no");
? ?? ?? ?? ???}? ?
? ?? ?? ???}
? ?? ?? ???
? ?? ?? ???/**
? ?? ?? ?? ?* 修改内容之二: 把owner项内容改为Tshinghua
? ?? ?? ?? ?* 并在owner节点中加入date节点,date节点的内容为2004-09-11,还为date节点添加一个属性type
? ?? ?? ?? ?*/
? ?? ?? ???list = document.selectNodes("/books/owner" );
? ?? ?? ???iter = list.iterator();
? ?? ?? ???if(iter.hasNext()){
? ?? ?? ?? ???Element ownerElement = (Element)iter.next();
? ?? ?? ?? ???ownerElement.setText("Tshinghua");
? ?? ?? ?? ???Element dateElement = ownerElement.addElement("date");
? ?? ?? ?? ???dateElement.setText("2004-09-11");
? ?? ?? ?? ???dateElement.addAttribute("type","Gregorian calendar");
? ?? ?? ???}
? ?? ?? ???
? ?? ?? ???/** 修改内容之三: 若title内容为Dom4j Tutorials,则删除该节点 */
? ?? ?? ???list = document.selectNodes("/books/book");
? ?? ?? ???iter = list.iterator();
? ?? ?? ???while(iter.hasNext()){
? ?? ?? ?? ???Element bookElement = (Element)iter.next();
? ?? ?? ?? ???Iterator iterator = bookElement.elementIterator("title");
? ?? ?? ?? ???while(iterator.hasNext()){
? ?? ?? ?? ?? ?? ?Element titleElement=(Element)iterator.next();
? ?? ?? ?? ?? ?? ?if(titleElement.getText().equals("Dom4j Tutorials")){
? ?? ?? ?? ?? ?? ?? ?bookElement.remove(titleElement);
? ?? ?? ?? ?? ?? ?}
? ?? ?? ?? ???}
? ?? ?? ???}? ?? ?? ??
? ?? ?? ???
? ?? ?? ???try{
? ?? ?? ?? ???/** 将document中的内容写入文件中 */
? ?? ?? ?? ???XMLWriter writer = new XMLWriter(new FileWriter(new File(newfilename)));
? ?? ?? ?? ???writer.write(document);
? ?? ?? ?? ???writer.close();
? ?? ?? ?? ???/** 执行成功,需返回1 */
? ?? ?? ?? ???returnValue = 1;
? ?? ?? ???}catch(Exception ex){
? ?? ?? ?? ???ex.printStackTrace();
? ?? ?? ???}
? ?? ?? ???
? ?? ? }catch(Exception ex){
? ?? ?? ???ex.printStackTrace();
? ?? ? }
? ?? ? return returnValue;
? ? }
? ???

说明:
List list = document.selectNodes("/books/book/@show" );
list = document.selectNodes("/books/book");
上述代码通过xpath查找到相应内容。

通过setValue()、setText()修改节点内容。

通过remove()删除节点或属性。

5. 格式化输出和指定编码

默认的输出方式为紧凑方式,默认编码为UTF-8,但对于我们的应用而言,一般都要用到中文,并且希望显示时按自动缩进的方式的显示,这就需用到OutputFormat类。

    Dom4jDemo.java?
    package com.holen.dom4j;

    import java.io.File;
    import java.io.FileWriter;
    import java.util.Iterator;
    import java.util.List;

    import org.dom4j.Attribute;
    import org.dom4j.Document;
    import org.dom4j.DocumentHelper;
    import org.dom4j.Element;
    import org.dom4j.io.OutputFormat;
    import org.dom4j.io.SAXReader;
    import org.dom4j.io.XMLWriter;

    //如果是UTF-8?FileWriter 改用 FileOutputStream?public class?Dom4jDemo{??public?Dom4jDemo (){}
?? public static void main (String[] args){?? ? ? ? ?Dom4jDemo temp = new?Dom4jDemo();?? ? ? ? temp.createXMLFile("D:/beans.xml");?? ? ? ? temp.ModiXMLFile("D:/beans.xml","D:/beans1.xml");?? ? ? ? ?temp.formatXMLFile("D:/beans1.xml");?? ? ?}
    }

?

热点排行