前面寫了一篇博客介紹了java解析xml的方式之一DOM。但是使用DOM解析有一個問題,那就是DOM的解析是一次性把xml文檔加載到內存裏,然後在解析。那麼問題就來了,當所需要解析的xml文檔很大的時候內存可能就不夠用。那麼今天就介紹第二種解析xml文檔的方式SAX
SAX解析xml文檔的方式是一句一句的讀入,並且一句一句的解析。這樣就不存在內存不夠用的情況了。
下面是SAX解析xml文檔的步驟:
1、構建XMLReader對象
2、構建DefaultHandler對象(在這裏可以創建一個內部類,並重寫其中的StartElement、EndElement、characters方法。當然單獨創建一個類也是可以的)
3、爲XMLReader對象設置默認的處理器。
4、設置需要解析的xml文檔。
OK,以上就是SAX解析的步驟,當然了僅僅只是以上的步驟看起來是非常難理解的。那麼下面我們就來實現一個小例子。
下面是一個Student.xml文檔
<?xml version="1.0" encoding="UTF-8"?>
<Students>
<Student name="zhangsan">
<age>22</age>
<height>176</height>
</Student>
<Student name="lisi">
<age>20</age>
<height>186</height>
</Student>
<Student name="wangwu">
<age>24</age>
<height>196</height>
</Student>
</Students>
我們的目的是要解析該xml文檔,將學生的信息保存在一個集合中。下面就是具體的代碼,附帶有註釋。
import java.io.FileInputStream;
import java.util.ArrayList;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
public class SAX {
public static void main(String[] args)
{
final ArrayList<Student> list = new ArrayList<Student>();//定義一個集合,用於保存學生信息,需要在內部類裏使用所以定義爲final類型
try {
XMLReader reader = SAXParserFactory.newInstance().newSAXParser().getXMLReader();//構建XMLReader對象
/*
* 以內部類的形式創建默認的處理器
* 下面重寫的方法都是回調方法,在符合條件的情況下自動調用
*/
DefaultHandler handler = new DefaultHandler(){
StringBuilder builder = new StringBuilder();
String name = "";
int age = 0;
int height = 0;
Student stu = null;
@Override
public void startElement(String uri, String localName,
String qName, Attributes attributes)//讀到開始標籤是調用該方法
throws SAXException {
// TODO Auto-generated method stub
super.startElement(uri, localName, qName, attributes);
//名字是存在Student標籤內的,所以讀到Student標籤的時候獲取name
if("Student".equals(qName))
{
name = attributes.getValue("name");//通過attributes.getValue()方法獲取屬性值
}
builder = new StringBuilder();//將緩存值清空,以免下次讀取的時候影響
}
@Override
public void endElement(String uri, String localName,//讀取到結束標籤的時候自動調用
String qName) throws SAXException {
// TODO Auto-generated method stub
super.endElement(uri, localName, qName);
if("age".equals(qName))
{
age = Integer.parseInt(builder.toString());
}else if("height".equals(qName))
{
height = Integer.parseInt(builder.toString());
}else if("Student".equals(qName))
{
//System.out.println(name + " Age:" + age + " Height:" + height);
stu = new Student(name,age,height);
list.add(stu);
}
}
@Override
public void characters(char[] ch, int start, int length)//解析到標籤中值的時候自動調用
throws SAXException {
// TODO Auto-generated method stub
super.characters(ch, start, length);
builder.append(ch,start,length);
}
};
reader.setContentHandler(handler);//設置處理器
reader.parse(new InputSource(new FileInputStream("Student.xml")));//設置xml文檔
for(Student s: list)//遍歷集合輸出學生信息
{
System.out.println(s.toString());
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
以上就是SAX解析的具體代碼。
下面是學生類
public class Student {
private String name;
private int age;
private int height;
public Student(String name, int age, int height) {
super();
this.name = name;
this.age = age;
this.height = height;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
public int getHeight() {
return height;
}
public void setHeight(int height) {
this.height = height;
}
@Override
public String toString() {
return "Student [name=" + name + ", age=" + age + ", height=" + height
+ "]";
}
}
當然了,SAX雖然能解析較大的xml文檔,但是也有其自身的缺陷,那就是它自能解析xml文檔,不能對其進行修改