android實現XML文件解析之SAX解析器

 

XML文件:可擴展標記語言,在android中應用非常廣泛。

android中常用的XML解析方式有三種,分別是:SAX解析器、、DOM解析器和PULL解析器。其中SAX解析器由於其解析速度快,佔用內存少,而被普遍採用。

 

SAX方式

SAXSimple API for XML的縮寫。是一個包也可以看成是一些接口。

相比於DOM而言SAX是一種速度更快,更有效,佔用內存更少的解析XML文件的方法。它是逐行掃描,可以做到邊掃描邊解析,因此SAX可以在解析文檔的任意時刻停止解析。非常適用於Android等移動設備。

SAX是基於事件驅動的。所謂事件驅動就是說,它不用解析完整個文檔,在按內容順序解析文檔過程中,SAX會判斷當前讀到的字符是否符合XML文件語法中的某部分。如果符合某部分,則會觸發事件。所謂觸發事件,就是調用一些回調方法。當然android的事件機制是基於回調方法的,在用SAX解析xml文檔時候,在讀取到文檔開始和結束標籤時候就會回調一個事件,在讀取到其他節點與內容時候也會回調一個事件。在SAX接口中,事件源是org.xml.sax包中的XMLReader,它通過parser()方法來解析XML文檔,併產生事件。事件處理器是org.xml.sax包中ContentHanderDTDHanderErrorHandler,以及EntityResolver4個接口。

這四個接口的詳細說明如下:

 

事件處理器名稱

事件處理器處理的事件

XMLReader註冊方法

ContentHander

XML文檔的開始與結束,

XML文檔標籤的開始與結束,接收字符數據,跳過實體,接收元素內容中可忽略的空白等。

setContentHandler(ContentHandler h)

DTDHander

處理DTD解析時產生的相應事件

setDTDHandler(DTDHandler h)

ErrorHandler

處理XML文檔時產生的錯誤

setErrorHandler(ErrorHandler h)

EntityResolver

處理外部實體

setEntityResolver(EntityResolver e)

 

我們用來做內容解析的回調方法一般都定義在ContentHandler接口中

ContentHandler接口常用的方法:

startDocument()  

     當遇到文檔的開頭的時候,調用這個方法,可以在其中做一些預處理的工作。
endDocument()    

     當文檔結束的時候,調用這個方法,可以在其中做一些善後的工作。 
startElement(String namespaceURI, String localName,String qName, Attributes atts)    

     當讀到開始標籤的時候,會調用這個方法。namespaceURI就是命名空間,localName是不帶命名空間前綴的標籤名,qName是帶命名空間前綴的標籤名。通過atts可以得到所有的屬性名和相應的值。
endElement(String uri, String localName, String name)   

   在遇到結束標籤的時候,調用這個方法。
characters(char[] ch, int start, int length)    

    這個方法用來處理在XML文件中讀到的內容。例如:<high data="30"/>主要目的是獲取high標籤中的值。

第一個參數用於存放文件的內容,後面兩個參數是讀到的字符串在這個數組中的起始位置和長度,使用new String(ch,start,length)就可以獲取內容。

注意:

SAX的一個重要特點就是它的流式處理,當遇到一個標籤的時候,它並不會紀錄下之前所碰到的標籤,即在startElement()方法中,所有能夠知道的信息,就是標籤的名字和屬性,至於標籤的嵌套結構,上層標籤的名字,是否有子元屬等等其它與結構相關的信息,都是不知道的,都需要你的程序來完成。這使得SAX在編程處理上沒有DOM方便。

現在我們截取一段XML文件來做解析,其調用方法是這樣的:

<?xml version="1.0"?>         ---------->         startDocument()

<weather>                               ---------->         startElement

<forecast_information>       ---------->         startElement

<city>                                       ---------->         startElement

beijing                                     ---------->        characters

</city>                                      ---------->        endElement

</forecast_information >     ---------->        endElement

</weather >                            ---------->        endElement

文檔結束                                 ---------->        endDocument()

SAX的解析步驟:

首先需要注意的是:

SAX還爲其制定了一個Helper類:DefaultHandler它實現了ContentHandler這個接口,但是其所有的方法體都爲空,在實現的時候,你只需要繼承這個類,然後重載相應的方法即可。

使用SAX解析XML文件一般有以下五個步驟:
1
、創建一個SAXParserFactory對象;
2
、調用SAXParserFactory中的newSAXParser方法創建一個SAXParser對象;
3
、然後在調用SAXParser中的getXMLReader方法獲取一個XMLReader對象;

4、實例化一個DefaultHandler對象

5、連接事件源對象XMLReader到事件處理類DefaultHandler

6、調用XMLReaderparse方法從輸入源中獲取到的xml數據

7、通過DefaultHandler返回我們需要的數據集合。

 

轉載:http://blog.163.com/xk_maomao/blog/static/17601634520126313101694/

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章