Python_爬蟲_四(XPath)

XPath

  1. 什麼是XPath
    xpath(XML Path Language)是一門在XML和HTML文檔中查找信息的語言,可以用來在XML和HTML文檔中對元素和屬性進行遍歷。

  2. XPath開發工具
    chrome插件XPath Helper
    firefox插件Try XPath

  3. 使用方法
    使用//獲取整個頁面當中的元素,然後寫標籤名,然後再寫謂詞進行提取。比如:

//div[@class="abc"]
  1. 需要注意的知識點
    1、/和//的區別:/代表只獲取直接子節點。 //獲取子孫節點。
    2、contains: 有時候某個屬性中包含了多個值,那麼可以使用’contains’函數
    //div[contains(@class,'job_detail')]
    
    3、謂詞中的下標是從1開始的不是從0開始的
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章