最近在幫別人寫解析xml,百度了很多,自己也總結了一下
關於解析xml,這篇博客有很詳細的介紹,四種方法解析xml:http://www.cnblogs.com/Qian123/p/5231303.html
下面是自己總結的Dom方式解析xml
項目結構:
先來一個xml文件:
<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book name="書本1" id="1">
<name>
<name1>大話數據結構</name1>
<name2>大話數據庫</name1>
<name3>設計模式</name1>
</name>
<year>2019</year>
<price>77</price>
<language>中文</language>
</book>
<book name="書本2" id="2">
<name>kvm</name>
<year>2019</year>
<price>66</price>
<language>英文</language>
</book>
<book name="書本3" id="3">
<name>數據庫</name>
<year>2019年</year>
<price>16</price>
<language>中文</language>
</book>
<book name="書本4" id="4">
<name>Java大全</name>
<year>1986年</year>
<price>88</price>
<language>最流行編程之一</language>
</book>
</bookstore>
第一個<name>裏有嵌套,也可以自行去掉,都可以解析成功
節點中的屬性name和id也都可以刪去,不影響解析
然後上代碼:
package dom;
import org.w3c.dom.Document;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.IOException;
public class DOMTest {
public static void main(String[] args) {
//1、創建一個DocumentBuilderFactory的對象
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
//2、創建一個DocumentBuilder的對象
try {
DocumentBuilder db = dbf.newDocumentBuilder();
//通過DocumentBuilder對象的parser方法加載books.xml文件到當前項目下
Document document = db.parse("src/dom/books.xml"); //doucument對象接受Parse的返回值
//獲取XML文件所有節點的集合。
NodeList List1 = document.getElementsByTagName("book");
//遍歷每一個節點信息
System.out.println("一共有"+List1.getLength()+"本書");
for(int i=0;i<List1.getLength();i++) {
System.out.println("=================下面開始遍歷第" + (i + 1) + "個節點的內容=================");
//通過item(i)方法 獲取一個List節點,nodelist的索引值從0開始
Node one = List1.item(i);
//獲取當前節點的所有屬性
NamedNodeMap attrs =one.getAttributes();
System.out.println("第"+(i+1)+"本書" + "共有"+attrs.getLength()+"個屬性");
//遍歷book屬性
for(int j=0;j<attrs.getLength();j++) {
//通過item(index)方法獲取one節點的某一個屬性
Node attr = attrs.item(j);
//獲取屬性名
System.out.print("屬性名:"+attr.getNodeName());
//獲取屬性值
System.out.println("屬性值:"+attr.getNodeValue());
}
//解析當前節點的子節點
NodeList childNodes = one.getChildNodes();
//遍歷childNodes獲取每個節點的節點名和節點值
System.out.println("第" + (i+1) + "個節點共有" + (childNodes.getLength()-1)/2 + "個子節點");
for (int k = 0; k < childNodes.getLength(); k++) {
//區分text類型的node以及element類型的node,去除text
if (childNodes.item(k).getNodeType()==Node.ELEMENT_NODE) {
//獲取了element類型的節點名
System.out.print("第"+(k+1)/2+"個子節點的節點名: "+childNodes.item(k).getNodeName());
//獲取了element類型節點的節點值
//System.out.println("--節點值是:"+childNodes.item(k).getFirstChild().getNodeValue());
System.out.println("--節點值是:"+childNodes.item(k).getTextContent());
}
}
System.out.println("=================結束遍歷第" + (i + 1) + "個節點的內容=================");
}
}catch (ParserConfigurationException e){ //捕獲不同的異常
e.printStackTrace();
}catch (SAXException e) {
e.printStackTrace();
}catch (IOException e){
e.printStackTrace();
}
}
}
運行結果:
一共有4本書
=================下面開始遍歷第1個節點的內容=================
第1本書共有2個屬性
屬性名:id屬性值:1
屬性名:name屬性值:書本1
第1個節點共有4個子節點
第1個子節點的節點名: name--節點值是:
大話數據結構
大話數據庫
設計模式
第2個子節點的節點名: year--節點值是:2019
第3個子節點的節點名: price--節點值是:77
第4個子節點的節點名: language--節點值是:中文
=================結束遍歷第1個節點的內容=================
=================下面開始遍歷第2個節點的內容=================
第2本書共有2個屬性
屬性名:id屬性值:2
屬性名:name屬性值:書本2
第2個節點共有4個子節點
第1個子節點的節點名: name--節點值是:kvm
第2個子節點的節點名: year--節點值是:2019
第3個子節點的節點名: price--節點值是:66
第4個子節點的節點名: language--節點值是:英文
=================結束遍歷第2個節點的內容=================
=================下面開始遍歷第3個節點的內容=================
第3本書共有2個屬性
屬性名:id屬性值:3
屬性名:name屬性值:書本3
第3個節點共有4個子節點
第1個子節點的節點名: name--節點值是:數據庫
第2個子節點的節點名: year--節點值是:2019年
第3個子節點的節點名: price--節點值是:16
第4個子節點的節點名: language--節點值是:中文
=================結束遍歷第3個節點的內容=================
=================下面開始遍歷第4個節點的內容=================
第4本書共有2個屬性
屬性名:id屬性值:4
屬性名:name屬性值:書本4
第4個節點共有4個子節點
第1個子節點的節點名: name--節點值是:Java大全
第2個子節點的節點名: year--節點值是:1986年
第3個子節點的節點名: price--節點值是:88
第4個子節點的節點名: language--節點值是:最流行編程之一
=================結束遍歷第4個節點的內容=================Process finished with exit code 0