xpath如此簡單

原創

2018-09-11 07:57

1首先需要調用lxml 和lxml.html模塊

2做成doc文件：兩種方法：doc = lxml.html.fromstring(page) doc=soupparser.fromstring(page)

3解析首先分清節點。取text例如：直接調用xpath即可：doc.xpath('//books/title/text()')是books節點下的title的文本內容。還有就是取標籤：doc.xpath('//title/@lang')取得title下的屬性爲lang的標籤的內容

4另附xpath基本語法：http://www.w3school.com.cn/xpath/xpath_syntax.asp

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

24小時熱門文章

最新文章

最新評論文章