SAX的全称是Simple APIs for XML,也即XML简单应用程序接口。
使用DOM解析XML时,首先将XML文档加载到内存当中,然后可以通过随机的方式访问内存中的DOM树;SAX是基于事件而且是顺序执行的,一旦经过了某个元素,我们就没有办法再去访问他了,SAX不必事先将整个XML文档加载到内存中,因此它占据内存要比DOM小,对于大型的XML文档来说,通常会使用SAX而不是DOM进行解析。
SAX提供的访问模式是一种顺序模式,这是一种快速读写XML数据的方式。当使用SAX分析器对XML文档进行分析时,会触发一系列事件,并激活相应的事件处理函数,应用程序通过这些事件处理函数实现对XML文档的访问,因而SAX接口也被称作事件驱动接口。
SAX分析器在对XML文档进行分析时,触发了一系列的事件,由于事件触发本身是有时序性的,因此,SAX提供的是一种顺序访问机制,对于已经分析过的部分,不能再倒回去重新处理。SAX之所以被叫做"简单"应用程序接口,是因为SAX分析器只做了一些简单的工作,大部分工作还要由应用程序自己去做。也就是说,SAX分析器在实现时,它只是顺序地检查XML文档中的字节流,判断当前字节是XML语法中的哪一部分、是否符合XML语法,然后再触发相应的事件,而事件处理函数本身则要由应用程序自己来实现。同DOM分析器相比,SAX分析器缺乏灵活性。然而,由于SAX分析器实现简单,对内存要求比较低,因此实现效率比较高,对于那些只需要访问XML文档中的数据而不对文档进行更改的应用程序来说,SAX分析器更为合适。
SAX使用观察者模式
1、SAX分析器的大体构成框架
图中最上方的SAXParserFactory用来生成一个分析器实例。XML文档是从左侧箭头所示处读入,当分析器对文档进行分析时,就会触发在DocumentHandler,ErrorHandler,DTDHandler以及EntityResolver接口中定义的回调方法。
•SAX是事件驱动的,文档的读入过程就是SAX的解析过程。
•在读入的过程中,遇到不同的项目,解析器会调用不同的处理方法。
2、工厂及解释器的使用同DOM
SAXParserFactory、SAXParser
- import java.io.File;
- import javax.xml.parsers.SAXParser;
- import javax.xml.parsers.SAXParserFactory;
- import org.xml.sax.Attributes;
- import org.xml.sax.SAXException;
- import org.xml.sax.helpers.DefaultHandler;
- public class SaxTest
- {
- public static void main(String[] args) throws Exception, SAXException
- {
- //step1:获得SAX解析器工厂实例
- SAXParserFactory factory = SAXParserFactory.newInstance();
- //step2:获得SAX解析器实例
- SAXParser parser = factory.newSAXParser();
- //step3:开始进行解析
- parser.parse(new File("student.xml"), new MyHandler());
- }
- }
- class MyHandler extends DefaultHandler
- {
- @Override
- public void startDocument() throws SAXException
- {
- System.out.println("parse began");
- }
- @Override
- public void endDocument() throws SAXException
- {
- System.out.println("parse end");
- }
- @Override
- public void startElement(String uri, String localName, String qName,
- Attributes attributes) throws SAXException
- {
- System.out.println("start element");
- }
- @Override
- public void endElement(String uri, String localName, String qName)
- throws SAXException
- {
- System.out.println("finished element");
- }
- }
解析一个XML文档,xml文档内容:
- <?xml version="1.0" encoding="UTF-8"?>
- <学生名册>
- <学生 学号="1">
- <姓名>张三</姓名>
- <性别>男</性别>
- <年龄>20</年龄>
- </学生>
- <学生 学号="2">
- <姓名>李四</姓名>
- <性别>女</性别>
- <年龄>19</年龄>
- </学生>
- <学生 学号="3">
- <姓名>王五</姓名>
- <性别>男</性别>
- <年龄>21</年龄>
- </学生>
- </学生名册>
具体的解析程序:
- import java.io.File;
- import java.util.Stack;
- import javax.xml.parsers.ParserConfigurationException;
- import javax.xml.parsers.SAXParser;
- import javax.xml.parsers.SAXParserFactory;
- import org.xml.sax.Attributes;
- import org.xml.sax.SAXException;
- import org.xml.sax.helpers.DefaultHandler;
- public class SaxTest2
- {
- public static void main(String[] args) throws Exception
- {
- SAXParserFactory factory =SAXParserFactory.newInstance();
- SAXParser parser = factory.newSAXParser();
- parser.parse(new File("student.xml"), new MyHandler2());
- }
- }
- class MyHandler2 extends DefaultHandler
- {
- private Stack<String> stack = new Stack<String>();
- private String name;
- private String gender;
- private String age;
- @Override
- public void startElement(String uri, String localName, String qName,
- Attributes attributes) throws SAXException
- {
- stack.push(qName);
- for(int i = 0;i<attributes.getLength();i++)
- {
- String attrName = attributes.getQName(i);
- String attrValue = attributes.getValue(i);
- System.out.println(attrName + "=" + attrValue);
- }
- }
- @Override
- public void characters(char[] ch, int start, int length)
- throws SAXException
- {
- String tag = stack.peek();
- if("姓名".equals(tag))
- {
- name = new String(ch,start,length);
- }
- else if("性别".equals(tag))
- {
- gender = new String(ch,start,length);
- }
- else if("年龄".equals(tag))
- {
- age = new String(ch,start,length);
- }
- }
- @Override
- public void endElement(String uri, String localName, String qName)
- throws SAXException
- {
- stack.pop();//表示该元素已经解析完毕,需要从栈中弹出
- if("学生".equals(qName))
- {
- System.out.println("姓名:"+ name);
- System.out.println("性别" + gender);
- System.out.println("年龄" + age);
- System.out.println();
- }
- }
- }