XPath 介紹
XPath(XML Path Language)是XML路徑語言用來,定位XML中某部分的位置
XPath 節點
在 XPath 中,有七種類型的節點:元素、屬性、文本、命名空間、處理指令、註釋以及文檔(根)節點。XML 文檔是被作爲節點樹來對待的。樹的根被稱爲文檔節點或者根節點。
常見概念
- 基本值(或原子值,Atomic value):無父或無子的節點
- 項目(Item):基本值或節點
節點關係
-
父(Parent):假如節點a下一層是節點b,則節點a就叫節點b的父
#節點a是節點b的父,節點b是節點c的父 #節點a不是節點c的父 <a> <b> <c></c> </b> </a>
-
子(Children):假如節點a的下一層是節點b,則節點b就叫節點a的子
#節點c是節點b的子,節點b是節點a的子 #節點c不是節點a的子 <a> <b> <c></c> </b> </a>
-
同胞(Sibling):父相同的節點
#節點b、c是同胞 <a> <b></b> <c></c> </a>
-
先輩(Ancestor):節點的父、父的父…
#節點a是節點b、c的先輩,節點b是節點c的先輩 <a> <b> <c></c> </b> </a>
-
後代(Descendant):節點的子、子的子…
#節點c是節點a、b的後代,節點b是節點a的後代 <a> <b> <c></c> </b> </a>
XPath 語法
XPath使用路徑表達式來選取XML文檔,節點是通過路徑(Path)或步(steps)來選取的
路徑表達式
講解概念會使用到的XML文檔
<?xml version="1.0" encoding="ISO-8859-1"?>
<bookstore>
<book>
<title lang="eng">Harry Potter</title>
<price>29.99</price>
</book>
<book>
<title lang="eng">Learning XML</title>
<price>39.95</price>
</book>
</bookstore>
常用路徑表達式及其含義
表達式 | 含義 | 例子 |
---|---|---|
nodename | 選取此節點的所有子節點 | bookstore,選取bookstore的所有子節點,bookstore/book,選取屬於 bookstore 的子元素的所有 book 元素 |
/ | 從根節點選取 | /bookstore,選取根元素 bookstore。注:路徑起始於正斜槓( / ),則此路徑代表到某元素的絕對路徑 |
// | 從匹配選擇的當前節點選擇文檔中的節點,而不考慮它們的位置 | //book,選取所有 book 子元素,而不管它們在文檔中的位置 |
. | 選取當前節點 | |
… | 選取當前節點的父節點 | |
@ | 選取屬性 | //@lang,選取名爲 lang 的所有屬性。 |
謂語
謂語用來查找某個特定的節點或者包含某個指定的值的節點。謂語在方括號中使用。
謂語常見的用法及含義
表達式 | 含義 |
---|---|
/bookstore/book[1] | 選取bookstore 子元素裏的第一個book元素 |
/bookstore/book[last()] | 選取屬於 bookstore 子元素裏的最後一個book 元素。 |
/bookstore/book[last()-1] | 選取屬於 bookstore 子元素裏的倒數第二個 book 元素。 |
/bookstore/book[position()< 3] | 選取屬於 bookstore 元素的子元素的最前面的兩個 book 元素。 |
//title[@lang] | 選取所有擁有名爲 lang 的屬性的 title 元素。 |
/bookstore/book[price>35.00] | 選取 bookstore 元素中的 price 元素的值大於 35.00的所有 book 元素。 |
通配符
XPath通配符可以用於匹配未知XML元素
通配符 | 含義 | 例子 |
---|---|---|
* | 匹配任何元素節點。 | /bookstore/* 選取 bookstore 元素的所有子元素。 |
@* | 匹配任何屬性節點。 | //title[@*] 選取所有有屬性的 title 元素。 |
node() | 匹配任何類型的節點。 |
選取若干路徑
在路徑表達式中使用"|"運算符,可以選取若干路徑
表達式 | 含義 |
---|---|
//book/title | //book/price | 選取 book 元素的子元素 title 和 price 。 |
//title | //price | 選取文檔中的所有 title 和 price 元素。 |
/bookstore/book/title | //price | 選取屬於 bookstore 元素的 book 元素的所有 title 元素,以及文檔中所有的 price 元素。 |
XPath 軸
軸可定義相對於當前節點的節點集。
常見軸名稱及含義
表達式 | 含義 |
---|---|
ancestor | 選取當前節點的所有先輩。 |
ancestor-or-self | 選取當前節點的所有先輩以及當前節點本身。 |
attribute | 選取當前節點的所有屬性。 |
child | 選取當前節點的所有子元素。 |
descendant | 選取當前節點的所有後代元素。 |
descendant-or-self | 選取當前節點的所有後代元素以及當前節點本身。 |
following | 選取文檔中當前節點的結束標籤之後的所有節點。 |
namespace | 選取當前節點的所有命名空間節點。 |
parent | 選取當前節點的父節點。 |
preceding | 選取文檔中當前節點的開始標籤之前的所有節點。 |
preceding-sibling | 選取當前節點之前的所有同級節點。 |
self | 選取當前節點。 |
位置路徑表達式
位置路徑分爲兩種:
- 絕對路徑:起始於"/",如/step/step/step…
- 相對路徑:step/step/step…
每個步step都是根據當前節點集之中的節點來進行計算
步(step)
步包括:
- 軸(axis):定義所選節點與當前節點之間的樹關係
- 節點測試(node-test):識別軸內部的節點
- 謂語(predecate):提煉所選的節點集
步語法
軸名稱::節點測試[謂語]
常見步及其意義
步 | 含義 |
---|---|
child::book | 選取所有屬於當前節點的子元素的 book 節點。 |
attribute::lang | 選取當前節點的 lang 屬性。 |
child:: * | 選取當前節點的所有子元素。 |
attribute:: * | 選取當前節點的所有屬性。 |
child::text() | 選取當前節點的所有文本子節點。 |
child::node() | 選取當前節點的所有子節點。 |
descendant::book | 選取當前節點的所有 book 後代。 |
ancestor::book | 選擇當前節點的所有 book 先輩。 |
ancestor-or-self::book | 選取當前節點的所有 book 先輩以及當前節點(如果此節點是 book 節點) |
child:: */child::price | 選取當前節點的所有 price 孫節點。 |
XPath 運算符
XPath 表達式可返回節點集、字符串、邏輯值以及數字。
常見運算符
運算符 | 含義 | 例子 |
---|---|---|
| | 計算兩個節點集 | //book | //cd,返回所有擁有 book 和 cd 元素的節點集 |
+ | 加法 | 6 + 4,返回10 |
- | 減法 | 6 - 4,返回2 |
* | 乘法 | 6 * 4,返回24 |
div | 除法 | 8 div 4,返回2 |
= | 等於 | price=9.80,如果 price 是 9.80,則返回 true,否則返回 false。 |
!= | 不等於 | price!=9.80,如果 price 是 9.80,則返回 false,否則返回 true。 |
< | 小於 | price<9.80,如果 price小於9.80,則返回 true,否則返回 false。 |
<= | 小於或等於 | price<=9.80 ,如果 price小於等於9.80,則返回 true,否則返回 false。 |
> | 大於 | price>9.80,如果 price大於9.80,則返回 true,否則返回 false。 |
>= | 大於或等於 | price>=9.80,如果 price大於等於9.80,則返回 true,否則返回 false。 |
or | 或 | price=9.80 or price=9.70,如果 price 是 9.80或9.70,則返回 true,否則返回 false。 |
and | 與 | price>9.00 and price<9.90 如果 price 大於9.00小於9.90,則返回 true,否則返回 false。 |
mod | 計算除法的餘數 | 5 mod 2,返回1 |
本文參考XPath教程