XPath基本使用教程

原創

素骨白筝

2020-06-09 05:14

一：簡介

XPath 是一門在 XML 文檔中查找信息的語言。
XPath 使用路徑表達式來選取 XML 文檔中的節點或者節點集。這些路徑表達式和我們在常規的電腦文件系統中看到的表達式非常相似。

二：XPath節點

在 XPath 中，有七種類型的節點：元素、屬性、文本、命名空間、處理指令、註釋以及文檔（根）節點。XML 文檔是被作爲節點樹來對待的。樹的根被稱爲文檔節點或者根節點。
案例：

<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
  <book>
    <title class="first">dublogger</title>
    <author>寸言思身</author>
    <year>2020</year>
    <price>0.00</price>
  </book>
</bookstore>

上面案例包含的節點有：

<bookstore> (文檔節點)

<author>寸言思身</author> (元素節點)

class="first" (屬性節點)

節點關係：
父（Parent）：【每個元素以及屬性都有一個父。】在上面的例子中，book 元素是 title、author、year 以及 price 元素的父：
子（Children）：【元素節點可有零個、一個或多個子。】在上面的例子中，title、author、year 以及 price 元素都是 book 元素的子：
同胞（Sibling）：【擁有相同的父的節點】在上面的例子中，title、author、year 以及 price 元素都是同胞：
先輩（Ancestor）：【某節點的父、父的父，等等。】在上面的例子中，title 元素的先輩是 book 元素和 bookstore 元素：
後代（Descendant）：【某個節點的子，子的子，等等。】在上面的例子中，bookstore 的後代是 book、title、author、year 以及 price 元素：

三：XPath語法：

案例：

<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
<book>
  <title class="first">dublogger_01</title>
  <price>29.99</price>
</book>
<book>
  <title class="first">dublogger_02</title>
  <price>39.95</price>
</book>
</bookstore>

選取節點：
XPath 使用路徑表達式在 XML 文檔中選取節點。節點是通過沿着路徑或者 step 來選取的。下面列出了最有用的路徑表達式:

表達式	描述
nodename	選取此節點的所有子節點。
/	從根節點選取。
//	從匹配選擇的當前節點選擇文檔中的節點，而不考慮它們的位置。
.	選取當前節點。
…	選取當前節點的父節點。
@	選取屬性。

部分表達式效果：

路徑表達式	結果
bookstore	選取 bookstore 元素的所有子節點。
/bookstore	選取根元素 bookstore。註釋：假如路徑起始於正斜槓( / )，則此路徑始終代表到某元素的絕對路徑！
bookstore/book	選取屬於 bookstore 的子元素的所有 book 元素。
//book	選取所有 book 子元素，而不管它們在文檔中的位置。
bookstore//book	選擇屬於 bookstore 元素的後代的所有 book 元素，而不管它們位於 bookstore 之下的什麼位置。
//@class	選取名爲 lang 的所有屬性

謂語

謂語用來查找某個特定的節點或者包含某個指定的值的節點。
謂語被嵌在方括號中。
在下面的表格中，我們列出了帶有謂語的一些路徑表達式，以及表達式的結果：

路徑表達式	結果
/bookstore/book[1]	選取屬於 bookstore 子元素的第一個 book 元素。
/bookstore/book[last()]	選取屬於 bookstore 子元素的最後一個 book 元素。
/bookstore/book[last()-1]	選取屬於 bookstore 子元素的倒數第二個 book 元素。
/bookstore/book[position() < 3]	選取最前面的兩個屬於 bookstore 元素的子元素的 book 元素。
//title[@class]	選取所有擁有名爲 class 的屬性的 title 元素。
//title[@lang=‘first’]	選取所有 title 元素，且這些元素擁有值爲 first 的 class 屬性。
/bookstore/book[price>35.00]	選取 bookstore 元素的所有 book 元素，且其中的 price 元素的值須大於 35.00。
/bookstore/book[price>35.00]//title	選取 bookstore 元素中的 book 元素的所有 title 元素，且其中的 price 元素的值須大於 35.00。

選取未知節點：
XPath 通配符可用來選取未知的 XML 元素。

通配符	描述
*	匹配任何元素節點。
@*	匹配任何屬性節點。
node()	匹配任何類型的節點。

在下面的表格中，我們列出了一些路徑表達式，以及這些表達式的結果：

路徑表達式	結果
/bookstore/*	選取 bookstore 元素的所有子元素。
//*	選取文檔中的所有元素。
//title[@*]	選取所有帶有屬性的 title 元素。

XPath 軸（Axes）

軸可定義相對於當前節點的節點集。

軸名稱	結果
ancestor	選取當前節點的所有先輩（父、祖父等）。
ancestor-or-self	選取當前節點的所有先輩（父、祖父等）以及當前節點本身。
attribute	選取當前節點的所有屬性。
child	選取當前節點的所有子元素。
descendant	選取當前節點的所有後代元素（子、孫等）。
descendant-or-self	選取當前節點的所有後代元素（子、孫等）以及當前節點本身。
following	選取文檔中當前節點的結束標籤之後的所有節點。
following-sibling	選取當前節點之後的所有兄弟節點
namespace	選取當前節點的所有命名空間節點。
parent	選取當前節點的父節點。
preceding	選取文檔中當前節點的開始標籤之前的所有節點。
preceding-sibling	選取當前節點之前的所有同級節點。
self	選取當前節點。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

XPath基本使用教程

一：簡介

二：XPath節點

三：XPath語法：

XPath 軸（Axes）

lightdb hash index的性能和限制

正則表達式萌新詳解

requests實戰爬取生產許可證信息

requests案例--度娘翻譯

Numpy小案例

Requests實戰小案例----豆瓣

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結