用JDOM處理XML文檔

用JDOM處理XML文檔


(一)JDOM的介紹以及與JAXB的比較

Java + XML = JDOM !
這就是JDOM設計者的目標。如果你曾經使用過煩人的SAX或是DOM來處理XML,你就會知道爲什麼要有JDOM或者是JAXB。在今年(2002)的JavaOne會議上JDOM的主要創始人Jason Hunter有一篇精彩的演講介紹了JDOM技術,題目就是JDOM Makes XML Easy。
在那篇文檔裏,JDOM被拿來與DOM比較,而我更願意拿它同JAXB比較。因爲JAXB和JDOM都是爲了在Java中提供比DOM和SAX更爲方便的XML處理接口而開發的,並且通過完全不同的途徑來解決這個問題。JDOM的處理方式是與DOM類似的樹操作。而JAXB通過DTD和綁定模式來生成訪問XML文檔的Java代碼,將XML映射成了Java對象來操作。你可以根據項目的需要和個人喜好來決定採用哪一個。
JDOM與JAXB的比較,從本身的特點來看:
1) JDOM比JAXB更容易上手。使用JAXB首先要會編寫DTD,然後還要會編寫綁定模式。JDOM沒有這樣的要求,如果你會Java和XML,甚至可以說光是看JDOM的javadoc文檔就能夠使用JDOM。
2) JAXB編寫好DTD和綁定模式以後,XML文檔被映射成了Java對象,其數據就是Java對象的屬性,連數據類型都做好了轉換,因此,訪問XML文檔比JDOM要簡便,可以說是一勞永逸。
3) JAXB由某個DTD和綁定模式生成的代碼只能訪問該DTD所約束的文檔。如果想要訪問其他XML文檔,需要再編寫DTD和綁定模式。JDOM可以處理任何XML文檔,包括受約束的和不受約束的。

目前JDOM和JAXB都沒有正式版本。JDOM的最新版本是beta8,JAXB是1.0 early access,其規範版本是0.21。相對而言,JDOM更成熟一些。例如JAXB不支持名字空間、不能向XML文檔寫入處理指令,有時我們需要保留的換行符和首尾空格在JAXB中自動過濾掉了,就連放在<![CDATA[ 和 ]]>裏面也不能倖免。JDOM就沒有這些限制。如果說以上的3點比較是JDOM和JAXB本身的特點所決定的,幾乎不可能改變,那麼這裏表明,JAXB還需要更多的工作。

(二)獲得並安裝JDOM
在http://jdom.org可以下載JDOM的最新版本。以JDOM beta8的2進製版本爲例。下載後解壓縮,JDOM的jar文件就是build目錄下的文件jdom.jar,將之加入類路徑。另外JDOM還需要lib目錄下那些jar文件如xerces.jar的支持。如果在使用中出現以下錯誤:
java.lang.NoSuchMethodError

java.lang.NoClassDefFoundError: org/xml/sax/SAXNotRecognizedException
你需要保證xerces.jar文件在CLASSPATH中位於其他XML類,如JAXP或Crimson之前,這些類文件,包括以前老版本的xerces,可能不支持SAX2.0或DOM Level 2。於是導致了上面的錯誤。

(三)一個簡單的例子
JDOM的處理方式有些類似於DOM,但它主要是用SAX實現的,你不必擔心處理速度和內存的問題。另外,JDOM中幾乎沒有接口,的類全部是實實在在的類,沒有類工廠類的。其最重要的一個包org.jdom中主要有以下類:
? Attribute
? CDATA
? Comment
? DocType
? Document
? Element
? EntityRef
? Namespace
? ProcessingInstruction
? Text
數據輸入要用到XML文檔要通過org.jdom.input包,反過來需要org.jdom.output。如前面所說,關是看API文檔就能夠使用。
我們的例子讀入XML文件exampleA.xml,加入一條處理指令,修改第一本書的價格和作者,並添加一條屬性,然後寫入文件exampleB.xml:
//exampleA.xml
<?xml version="1.0" encoding="GBK"?>
<bookList>
<book>
<name>Java編程入門</name>
<author>張三</author>
<publishDate>2002-6-6</publishDate>
<price>35.0</price>
</book>
<book>
<name>XML在Java中的應用</name>
<author>李四</author>
<publishDate>2002-9-16</publishDate>
<price>92.0</price>
</book>
</bookList>

//testJDOM.java
import org.jdom.*;
import org.jdom.output.*;
import org.jdom.input.*;
import java.io.*;
public class TestJDOM{
public static void main(String args[])throws Exception{

SAXBuilder sb = new SAXBuilder();

//從文件構造一個Document,因爲XML文件中已經指定了編碼,所以這裏不必了
Document doc = sb.build(new FileInputStream("exampleA.xml"));

//加入一條處理指令/
ProcessingInstruction pi = new ProcessingInstruction
("xml-stylesheet","href=/"bookList.html.xsl/" type=/"text/xsl/"");
doc.addContent(pi);


Element root = doc.getRootElement(); //得到根元素
java.util.List books = root.getChildren(); //得到根元素所有子元素的集合
Element book = (Element)books.get(0); //得到第一個book元素
//爲第一本書添加一條屬性
Attribute a = new Attribute("hot","true");
book.setAttribute(a);
Element author = book.getChild("author"); //得到指定的字元素
author.setText("王五//"); //將作者改爲王五/r
//或 Text t = new Text("王五//");book.addContent(t);
Element price = book.getChild("price"); //得到指定的字元素
//修改價格,比較鬱悶的是我們必須自己轉換數據類型,而這正是JAXB的優勢
author.setText(Float.toString(50.0f));



String indent = " ";
boolean newLines = true;
XMLOutputter outp = new XMLOutputter(indent,newLines,"GBK");
outp.output(doc, new FileOutputStream("exampleB.xml"));

}
};

執行結果exampleB.xml:
<?xml version="1.0" encoding="GBK"?>
<bookList>
<book hot=”true”>
<name>Java編程入門</name>
<author>50.0</author>
<publishDate>2002-6-6</publishDate>
<price>35.0</price>
</book>
<book>
<name>XML在Java中的應用</name>
<author>李四</author>
<publishDate>2002-9-16</publishDate>
<price>92.0</price>
</book>
</bookList>
<?xml-stylesheet href="bookList.html.xsl" type="text/xsl"?>

在默認情況下,JDOM的Element類的getText()這類的方法不會過濾空白字符,如果你需要過濾,用setTextTrim() 。


(四)參考文檔
1) JDOM Makes XML Easy (http://www.servlets.com/speaking/jdom-javaone.pdf)
2) The Java &#8482; Architecture for XML Binding User’s Guide (http://java.sun.com/xml/jaxb/jaxb-docs.pdf)
3) Web Services Made Easier. The Java TM APIs and Architectures for XML, A Technical White Paper (http://java.sun.com/xml/webservices.pdf )

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章