XML解析:
SAX和DOM解析的比較
在針對XML文檔的應用編程接口中,最主要的有W3C制定的DOM(Document Object Method,文檔對象模型)和由David Megginson領導的SAX(SimpleAPI for XML,用於XML的簡單API)。
SAX和DOM在實現過程中,分別側重於不同的方面以滿足不同的應用需求。DOM爲開發基於XML的應用系統提供了便利。它通過一種隨機訪問機制,使得應用程序利用該接口可以在任何時候訪問XML文檔中的任何一部分數據,也可以對XML文檔中的數據進行插入、刪除、修改、移動等操作。在DOM中,文檔的邏輯結構類似一棵樹。文檔、文檔中的根、元素、元素內容、屬性、屬性值等都是以對象模型的形式表示的。DOM的優點在於它在內存中保存文檔的整個模型。這使得能以任何順序訪問XML元素。然而,對於大型文檔來說,這樣做可能不方便。因爲它可能會用盡內存,或者當系統達到了它的極限時,機器的性能將
會慢下來。
SAX提供了一種對XML文檔進行順序訪問的模式,這是一種快速讀XML數據的方式。SAX接口是事件驅動的,當使用SAX分析器對XML文檔進行分析時,就會觸發一系列事件,並激活相應的事件處理函數,從而完成對XML文檔的訪問。SAX處理XML的方式與DOM不同。SAX解析器不是將DOM樹解析和表現爲輸出,它是基於事件的,所以在XML被解析時,事件被髮送給引擎。SAX可以在文檔的開始接收事件,也可以接收文檔中的元素。使用這些事件可以構建一種結構。因爲SAX沒有把XML文檔完全地加載到內存中,所以需要的系統資源較少,是一個分析大型XML文檔的高效API。缺點是編寫SAX比編寫DOM複雜,這因爲首先必須實現通知接口並維護狀態,其次SAX不允許對文檔進行隨機訪問,也沒有提供像DOM那樣的修改功能。
比較而言,DOM和SAX各有自己的應用場合。DOM適用於處理下面的問題:解析比較小的XML文件;需要對文檔進行修改;需要隨機對文檔進行訪問。SAX適於處理下面的問題:對大型文檔進行處理;只需要文檔的部分內容;只需要從文檔中得到特定信息。
DOM:
Document Object Model 文檔對象模型,由W3C制定標準規範 與具體語言無關 隨機訪問XML文檔重複讀
DOM的編程API:
Node:節點
Document :根節點表示整個文檔
NodeList:節點的集合
NamedNodeMap:一般用於存儲屬性
Element:
編程思路:
1.獲得DocumentBuilderFactory的實例
2.通過工廠獲得DocumentBuilder的解析器
3.parse(File)======>Document
------------MyDom.xml-----------
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import java.io.*;
import org.w3c.dom.Document;
import org.w3c.dom.NodeList;
import org.w3c.dom.Node;
import org.w3c.dom.Element;
import org.w3c.dom.Attr;
import org.w3c.dom.NamedNodeMap;
//通過DOM方式解析XML文檔
public class MyDom{
public static void main(String args[])throws Exception{
//1.得到工廠類(DocumentBuilderFactory)的實例
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
//2.得到解析器實例
DocumentBuilder builder=factory.newDocumentBuilder();
//3.使用parse()解析文件返回 文檔的根節點 Document
Document doc=builder.parse(new File("student.xml"));
Element root=doc.getDocumentElement();
System.out.println("根元素是:"+root.getTagName());
NodeList nl=doc.getElementsByTagName("student");
//NodeList nl=root.getChildNodes();
//遍歷NodeList
for(int i=0;i<nl.getLength();i++){
Node node=nl.item(i); //得到Node集合中的每一個
NamedNodeMap nnm=node.getAttributes();
for(int j=0;j<nnm.getLength();j++){
Node att_node=nnm.item(j);
Attr attr=(Attr)att_node;
String att_name=attr.getName();
String att_value=attr.getValue();
System.out.println(att_name+"="+att_value);
}
Element first=(Element)node;
System.out.println(first.getTagName());
//得到每個student元素的子節點
NodeList secs=node.getChildNodes();
System.out.println(secs.getLength());
for(int k=0;k<secs.getLength();k++){
//得到二級子節點
Node sec_node=secs.item(k);
//過濾空白
if(sec_node.getNodeType()==Node.ELEMENT_NODE){
Element sec=(Element)sec_node;
System.out.println(sec.getTagName());
System.out.println(sec.getTextContent());
}
}
}
}
}
----------MyDom2.xml--------------
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.DocumentBuilder;
import java.io.*;
import org.w3c.dom.*;
public class MyDom2{
public static void main(String args[])throws Exception{
DocumentBuilder builder=DocumentBuilderFactory.newInstance().newDocumentBuilder();
Document doc=builder.parse(new File("student.xml"));
NodeList firsts=doc.getElementsByTagName("student");
//遍歷一級子元素過程
for(int i=0;i<firsts.getLength();i++){
Element first=(Element)firsts.item(i);//student
String id_value=first.getAttribute("id");
String name=first.getElementsByTagName("name").item(0).getFirstChild().getNodeValue();
String age=first.getElementsByTagName("age").item(0).getFirstChild().getNodeValue();
String address=first.getElementsByTagName("address").item(0).getFirstChild().getNodeValue();
System.out.println("id is:"+id_value+"\t"+name+"\t"+age+"\t"+address);
// getChildNodes()
//NodeList first.getChildNodes();
}
}
}
DOM 創建文檔
---------------Create.java---------
import javax.xml.parsers.*;
import java.io.*;
import org.w3c.dom.*;
import javax.xml.transform.*;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;
public class Create{
public static void main(String args[])throws Exception{
//1.獲得工廠實例
DocumentBuilderFactory f=DocumentBuilderFactory.newInstance();
//2.得到解析器
DocumentBuilder builder=f.newDocumentBuilder();
//3.builder.newDocument();
Document doc=builder.newDocument();
//創建元素
Element root=doc.createElement("emps");
Element emp1=doc.createElement("emp");
Element name1=doc.createElement("name");
name1.setTextContent("etoak");
Element email1=doc.createElement("email");
email1.setTextContent("email1");
Element emp2=doc.createElement("emp");
Element name2=doc.createElement("name");
name2.setTextContent("etoak1");
Element email2=doc.createElement("email");
email2.setTextContent("email1");
//組裝 appendChild() Node
doc.appendChild(root);
root.appendChild(emp1);
root.appendChild(emp2);
emp1.appendChild(name1);
emp1.appendChild(email1);
emp2.appendChild(name2);
emp2.appendChild(email2);
//將DOcument實例持久化到磁盤上
//1.TransformerFactory 實例 newInstance();
TransformerFactory factory=TransformerFactory.newInstance();
//2.factory實例得到 Transformer 實例
Transformer former=factory.newTransformer();
former.setOutputProperty(OutputKeys.INDENT,"yes");
//構造源
DOMSource source=new DOMSource(doc);
//構造結果類型stream
StreamResult result=new StreamResult(new File("emp.xml"));
former.transform(source,result);
}
}
SAX:
Simple Api for XML (xml簡單處理API),提供了一種基於事件的XML的解析方式
多用於快速讀取XML文檔
基於事件驅動,在內存中並不會加載整個文檔,效率要高(解析大型XML文檔)
不能重複讀取 順序讀取模式
1.得到工廠實例
SAXParserFactory actory=SAXParserFactory.newInstance();
2.由工廠實例得到 解析器
SAXParser parser=factory.newSAXParser();
3.解析器 parse (File f,MyHandler extends DefaultHandler dh)
Class MyHandler extends DefaultHandler{
public void …
}
SAX應用程序構成圖
SAX解析實例
測試流程
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.*;
import org.xml.sax.helpers.DefaultHandler;
import org.xml.sax.SAXException;
import org.xml.sax.Attributes;
//使用SAX方式解析XML文檔
public class s1{
public static void main(String[] agrs)throws Exception{
//**** 使用 SAXParser.parse() 處理文件
//1、得到工廠的實例使用static 方法newInstance();
SAXParserFactory factory=SAXParserFactory.newInstance();
//2、使用工廠實例得到解析器 newSAXParser();
SAXParser parser=factory.newSAXParser();
//3、使用SAXParser.parse() 處理文件進行解析
parser.parse(new File("s1.xml"),new MyHandler());
}
}
//文檔處理器其中定義了很多回調方法 按照要求 重寫方法
class MyHandler extends DefaultHandler{
//文件開始的時候調用的方法
@Override
public void startDocument() throws SAXException{
System.out.println("文檔開始。。。");
}
//元素開始時調用的方法
@Override
public void startElement(String uri,String localName,String qName,Attributes attrs ) throws SAXException{
System.out.println("元素開始。。。");
}
@Override
public void characters(char[] ch,int start,int length)throws SAXException{
System.out.println("字符數據。。。");
}
public void endElement(String uri,String localName,String qName,Attributes attrs ) throws SAXException{
System.out.println("元素結束。。。");
}
@Override
public void endDocument() throws SAXException{
System.out.println("文檔結束。。。");
}
}
.遍歷文檔
----------Student.xml------------
<?xml version="1.0" encoding="GBK"?>
<students>
<student id="1">
<name>zhangsan</name>
<age>12</age>
<address>jinan</address>
</student>
<student id="2">
<name>lisi</name>
<age>23</age>
<address>shandong</address>
</student>
</students>
----------MySax.java:----------
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.*;
import org.xml.sax.helpers.DefaultHandler;
import org.xml.sax.SAXException;
import org.xml.sax.Attributes;
//使用SAX方式解析XML文檔完整遍歷過程
public class MySax{
public static void main(String args[])throws Exception{
//1.得到工廠的實例 使用static 方法newInstance();
SAXParserFactory factory=SAXParserFactory.newInstance();
//2.使用工廠實例得到 解析器 newSAXParser();
SAXParser parser=factory.newSAXParser();
// 使用 SAXParser.parse()處理文件
parser.parse(new File("student.xml"),new MyHandler());
}
}
//文檔處理器其中定義了很多回調方法 按照需求 重寫方法
class MyHandler extends DefaultHandler{
StringBuffer str=new StringBuffer("");
//文檔開始的時候調用的方法
@Override
public void startDocument() throws SAXException{
str.append("<?xml version=\"1.0\" encoding=\"GBK\"?>\n");
}
//元素開始的時候調用的方法
@Override
public void startElement(String uri,String localName,
String qName,Attributes attrs) throws SAXException{
str.append("<"+qName);//拼裝元素的開始標記
//如果有屬性則遍歷得到
for(int i=0;i<attrs.getLength();i++){
//得到屬性名字
String att_name=attrs.getQName(i);
//屬性值
String att_value=attrs.getValue(i);
str.append(" "+att_name+"=\""+att_value+"\"");
}
str.append(">");
}
@Override
public void characters(char[] ch,int start,int length)
throws SAXException{
str.append(new String(ch,start,length));
}
@Override
public void endElement(String uri,String localName,String qName)
throws SAXException{
str.append("</").append(qName).append(">");
}
@Override
public void endDocument()throws SAXException{
System.out.println(str.toString());
}
}
.在school.xml中查詢指定老師所帶的課程
result:
xx老師所帶的課程是 xxx
----------school.xml:---------
<?xml version="1.0" encoding="utf-8" ?>
<school>
<teachers>
<teacher age="30" course="jdbc" gender="male" name="kk">
<phone type="company"/>
<others><iphone/></others>
</teacher>
<teacher age="33" course="corejava" gender="male" name="David">
<phone type="company"/>
<others><iphone/></others>
</teacher>
<teacher age="30" course="hibernate struts" gender="male" name="adam">
<phone type="home"/>
<others>
<iphone>13944456789</iphone>
<iphone>13934567889</iphone>
</others>
</teacher>
</teachers>
<courses>
<course name="corejava"></course>
<course name="hibernate">持久層框架</course>
<course name="struts">視圖層框架</course>
<course name="ajax"></course>
<course name="jdbc"></course>
</courses>
<students>
<student age="23" gender="male" name="tom">
<subject sname="corejava"><score>80</score></subject>
<subject sname="hibernate"/>
<subject sname="struts"><score>88</score></subject>
<birthplace name="天津"/>
</student>
<student gender="male" name="Jimmy">
<subject sname="corejava"><score>82</score></subject>
<subject sname="hibernate"></subject>
<subject sname="struts"><score>83</score></subject>
<subject sname="ajax"><score>78</score></subject>
</student>
</students>
</school>
--------------Execl.java:-------------
import javax.xml.parsers.SAXParserFactory;
import javax.xml.parsers.SAXParser;
import java.io.*;
import org.xml.sax.helpers.DefaultHandler;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
public class Exec1{
public static void main(String args[])throws Exception{
SAXParser parser=SAXParserFactory.newInstance().newSAXParser();
parser.parse(new File("school.xml"),new MyHandler("David"));
}
}
class MyHandler extends DefaultHandler{
String teaName;
public MyHandler(String teaName){
this.teaName=teaName;
}
@Override
public void startElement(String uri,String localName,String qName,Attributes attrs)throws SAXException{
//首先,判讀當前讀到的標籤是不是teacher
if(qName.equals("teacher")){
//如果是則 讀取裏面的name屬性值
String tea=attrs.getValue("name");
//如果name屬性的值與傳入的teaName相等 則表示該老師就是所找的那一個
if(tea.equals(teaName)){
String course=attrs.getValue("course");
//打印輸出
System.out.println(teaName+"老師所在的課程是:"+course);
}
}
}
} //打印:David老師所在的課程是:corejava
.在school..xml中查詢選修了指定課程的學生以及分數 只查有分數的
result:xx 學生選修的xx課程是 xx 分
param: course
studentName 有可能
sname.value===course flag1
score flag2
(flag1&&flag2)charachers
----------Exec2.java:-------------
import javax.xml.parsers.SAXParserFactory;
import javax.xml.parsers.SAXParser;
import java.io.*;
import org.xml.sax.helpers.DefaultHandler;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
public class Exec2{
public static void main(String args[])throws Exception{
SAXParser parser=SAXParserFactory.newInstance().newSAXParser();
parser.parse(new File("school.xml"),new MyHandler("corejava"));
}
}
class MyHandler extends DefaultHandler{
String course;
String stuName; //預存學生名字
boolean flag1; //判斷課程是否是傳入的課程
boolean flag2; //判斷是否有分數
public MyHandler(String course){
this.course=course;
}
@Override
public void startElement(String uri,String localName,String qName,Attributes attrs)throws SAXException{
//判斷是否是學生如果是學生 則取名字
if("student".equals(qName)){
stuName=attrs.getValue("name");
}
//判斷課程是否與傳入的一致
if("subject".equals(qName)){//判斷開始標籤是否是subject
String courseName=attrs.getValue("sname");
if("corejava".equals(courseName))
flag1=true;
}
if("score".equals(qName))flag2=true;
}
public void characters(char ch[],int start ,int length)throws SAXException{
if(flag1 && flag2)
System.out.println(stuName+"選修的"+course+"分數是:"+new String(ch,start,length));
}
public void endElement(String uri,String localName,String qName)throws SAXException{
//把標記還原
if(qName.equals("student"))stuName="";
if(qName.equals("subject"))flag1=false;
if(qName.equals("score"))flag2=false;
}
}