Java解析XML文檔--SAX

前面寫了一篇博客介紹了java解析xml的方式之一DOM。但是使用DOM解析有一個問題,那就是DOM的解析是一次性把xml文檔加載到內存裏,然後在解析。那麼問題就來了,當所需要解析的xml文檔很大的時候內存可能就不夠用。那麼今天就介紹第二種解析xml文檔的方式SAX
SAX解析xml文檔的方式是一句一句的讀入,並且一句一句的解析。這樣就不存在內存不夠用的情況了。
下面是SAX解析xml文檔的步驟:
    1、構建XMLReader對象
    2、構建DefaultHandler對象(在這裏可以創建一個內部類,並重寫其中的StartElement、EndElement、characters方法。當然單獨創建一個類也是可以的)
    3、爲XMLReader對象設置默認的處理器。
    4、設置需要解析的xml文檔。
OK,以上就是SAX解析的步驟,當然了僅僅只是以上的步驟看起來是非常難理解的。那麼下面我們就來實現一個小例子。
下面是一個Student.xml文檔
<?xml version="1.0" encoding="UTF-8"?>
<Students>
    <Student name="zhangsan">
        <age>22</age>
        <height>176</height>
    </Student>
    <Student name="lisi">
        <age>20</age>
        <height>186</height>
    </Student>
    <Student name="wangwu">
        <age>24</age>
        <height>196</height>
    </Student>
</Students>

我們的目的是要解析該xml文檔,將學生的信息保存在一個集合中。下面就是具體的代碼,附帶有註釋。



import java.io.FileInputStream;
import java.util.ArrayList;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;

public class SAX {
    public static void main(String[] args)
    {
        final ArrayList<Student> list = new ArrayList<Student>();//定義一個集合,用於保存學生信息,需要在內部類裏使用所以定義爲final類型

        try {
            XMLReader reader = SAXParserFactory.newInstance().newSAXParser().getXMLReader();//構建XMLReader對象
            /*
             * 以內部類的形式創建默認的處理器
             * 下面重寫的方法都是回調方法,在符合條件的情況下自動調用
             */
            DefaultHandler handler = new DefaultHandler(){

                StringBuilder builder = new StringBuilder();
                String name = "";
                int age = 0;
                int height = 0;
                Student stu = null;

                @Override
                public void startElement(String uri, String localName,
                        String qName, Attributes attributes)//讀到開始標籤是調用該方法
                        throws SAXException {
                    // TODO Auto-generated method stub
                    super.startElement(uri, localName, qName, attributes);
                    //名字是存在Student標籤內的,所以讀到Student標籤的時候獲取name
                    if("Student".equals(qName))
                    {
                        name = attributes.getValue("name");//通過attributes.getValue()方法獲取屬性值
                    }
                    builder = new StringBuilder();//將緩存值清空,以免下次讀取的時候影響
                }

                @Override
                public void endElement(String uri, String localName,//讀取到結束標籤的時候自動調用
                        String qName) throws SAXException {
                    // TODO Auto-generated method stub
                    super.endElement(uri, localName, qName);
                    if("age".equals(qName))
                    {
                        age = Integer.parseInt(builder.toString());
                    }else if("height".equals(qName))
                    {
                        height = Integer.parseInt(builder.toString());
                    }else if("Student".equals(qName))
                    {
                        //System.out.println(name + "   Age:" + age + "  Height:" + height);
                        stu = new Student(name,age,height);
                        list.add(stu);
                    }

                }

                @Override
                public void characters(char[] ch, int start, int length)//解析到標籤中值的時候自動調用
                        throws SAXException {
                    // TODO Auto-generated method stub
                    super.characters(ch, start, length);
                    builder.append(ch,start,length);
                }

            };
            reader.setContentHandler(handler);//設置處理器
            reader.parse(new InputSource(new FileInputStream("Student.xml")));//設置xml文檔

            for(Student s: list)//遍歷集合輸出學生信息
            {
                System.out.println(s.toString());
            }


        } catch (Exception e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }

}

以上就是SAX解析的具體代碼。
下面是學生類

public class Student {
    private String name;
    private int age;
    private int height;
    public Student(String name, int age, int height) {
        super();
        this.name = name;
        this.age = age;
        this.height = height;
    }
    public String getName() {
        return name;
    }
    public void setName(String name) {
        this.name = name;
    }
    public int getAge() {
        return age;
    }
    public void setAge(int age) {
        this.age = age;
    }
    public int getHeight() {
        return height;
    }
    public void setHeight(int height) {
        this.height = height;
    }
    @Override
    public String toString() {
        return "Student [name=" + name + ", age=" + age + ", height=" + height
                + "]";
    }

}

當然了,SAX雖然能解析較大的xml文檔,但是也有其自身的缺陷,那就是它自能解析xml文檔,不能對其進行修改

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章