dom4j引见与基本使用

2012-12-21

dom4j介绍与基本使用介绍?dom4j是一个Java的XML API，类似于jdom，用来读写XML文件的。dom4j是一个非常非常优

dom4j介绍与基本使用

介绍

dom4j是一个Java的XML API，类似于jdom，用来读写XML文件的。dom4j是一个非常非常优秀的Java XML API，具有性能优异、功能强大和极端易用使用的特点，同时它也是一个开放源代码的软件，可以在SourceForge上找到它。在IBM developerWorks上面可以找到一篇文章，对主流的Java XML API进行的性能、功能和易用性的评测，dom4j无论在那个方面都是非常出色的。如今你可以看到越来越多的Java软件都在使用dom4j来读写XML，特别值得一提的是连Sun的JAXM也在用dom4j。这是必须使用的jar包， Hibernate用它来读写配置文件。

　　<books>

　　<title>Dom4j Tutorials</title>

　　</book>

　　<title>Lucene Studing</title>

　　</book>

　　<title>Lucene in Action</title>

　　</book>

　　<owner>O'Reilly</owner>

　　</books>

　　这是一个很简单的XML文档，场景是一个网上书店，有很多书，每本书有两个属性，一个是书名，一个为是否展示[show]，最后还有一项是这些书的拥有者[owner]信息。

<books><book show="yes"><title>Dom4j Tutorials</title></book><book show="yes"><title>Lucene Studing</title></book><book show="no"><title>Lucene in Action</title></book><owner>O'Reilly</owner></books>

　　Iterator iter = list.iterator();
　　while(iter.hasNext()){
　　Attribute attribute = (Attribute)iter.next();
　　if(attribute.getValue().equals("yes")){
　　attribute.setValue("no");
　　}
　　}
　　/**
　　* 修改内容之二: 把owner项内容改为Tshinghua
　　* 并在owner节点中加入date节点,date节点的内容为2004-09-11,还为date节点添加一个属性type
　　*/
　　list = document.selectNodes("/books/owner" );
　　iter = list.iterator();
　　if(iter.hasNext()){
　　Element ownerElement = (Element)iter.next();
　　ownerElement.setText("Tshinghua");
　　Element dateElement = ownerElement.addElement("date");
　　dateElement.setText("2004-09-11");
　　dateElement.addAttribute("type","Gregorian calendar");
　　}
　　/** 修改内容之三: 若title内容为Dom4j Tutorials,则删除该节点 */
　　list = document.selectNodes("/books/book");
　　iter = list.iterator();
　　while(iter.hasNext()){
　　Element bookElement = (Element)iter.next();
　　Iterator iterator = bookElement.elementIterator("title");
　　while(iterator.hasNext()){
　　Element titleElement=(Element)iterator.next();
　　if(titleElement.getText().equals("Dom4j Tutorials")){
　　bookElement.remove(titleElement);
　　}
　　}
　　}
　　try{
　　/** 将document中的内容写入文件中 */
　　XMLWriter writer = new XMLWriter(new FileWriter(new File(newfilename)));
　　writer.write(document);
　　writer.close();
　　/** 执行成功,需返回1 */
　　returnValue = 1;
　　}catch(Exception ex){
　　ex.printStackTrace();
　　}
　　}catch(Exception ex){
　　ex.printStackTrace();
　　}
　　return returnValue;
　　}
　　说明：
　　List list = document.selectNodes("/books/book/@show" );
　　list = document.selectNodes("/books/book");
　　上述代码通过xpath查找到相应内容。
　　通过setValue()、setText()修改节点内容。
　　通过remove()删除节点或属性。

5．格式化输出和指定编码
　　默认的输出方式为紧凑方式，默认编码为UTF-8，但对于我们的应用而言，一般都要用到中文，并且希望显示时按自动缩进的方式的显示，这就需用到OutputFormat类。
　　/**
　　* 格式化XML文档,并解决中文问题
　　* @param filename
　　* @return
　　*/
　　public int formatXMLFile(String filename){
　　int returnValue = 0;
　　try{
　　SAXReader saxReader = new SAXReader();
　　Document document = saxReader.read(new File(filename));
　　XMLWriter writer = null;
　　/** 格式化输出,类型IE浏览一样 */
　　OutputFormat format = OutputFormat.createPrettyPrint();
　　/** 指定XML编码 */
　　format.setEncoding("GBK");
　　writer= new XMLWriter(new OutputStreamWriter(new FileOutputStream("filename"),format.getEncoding()),format);
　　writer.write(document);
　　writer.close();
　　/** 执行成功,需返回1 */
　　returnValue = 1;
　　}catch(Exception ex){
　　ex.printStackTrace();
　　}
　　return returnValue;
　　}
　　说明：
　　OutputFormat format = OutputFormat.createPrettyPrint();
　　这句指定了格式化的方式为缩进式，则非紧凑式。
　　format.setEncoding("GBK");
　　指定编码为GBK。
　　XMLWriter writer = new XMLWriter(new FileWriter(new File(filename)),format);
　　这与前面两个方法相比，多加了一个OutputFormat对象，用于指定显示和编码方式。

热点排行

编程

dom4j引见与基本使用

<books><book show="yes"><title>Dom4j Tutorials</title></book><book show="yes"><title>Lucene Studing</title></book><book show="no"><title>Lucene in Action</title></book><owner>O'Reilly</owner></books>

<books><book show="yes"><title>Dom4j Tutorials</title></book><book show="yes"><title>Lucene Studing</title></book><book show="no"><title>Lucene in Action</title></book><owner>O'Reilly</owner></books>