XPath
-
什麼是XPath
xpath(XML Path Language)是一門在XML和HTML文檔中查找信息的語言,可以用來在XML和HTML文檔中對元素和屬性進行遍歷。 -
XPath開發工具
chrome插件XPath Helper
firefox插件Try XPath -
使用方法
使用//獲取整個頁面當中的元素,然後寫標籤名,然後再寫謂詞進行提取。比如:
//div[@class="abc"]
- 需要注意的知識點
1、/和//的區別:/代表只獲取直接子節點。 //獲取子孫節點。
2、contains: 有時候某個屬性中包含了多個值,那麼可以使用’contains’函數
3、謂詞中的下標是從1開始的不是從0開始的//div[contains(@class,'job_detail')]