xpath如此簡單

1首先需要調用lxml 和lxml.html模塊

2做成doc文件: 兩種方法:doc = lxml.html.fromstring(page)  doc=soupparser.fromstring(page)

3解析 首先分清節點。取text例如:直接調用xpath即可:doc.xpath('//books/title/text()')是books節點下的title的文本內容。還有就是取標籤:doc.xpath('//title/@lang')取得title下的屬性爲lang的標籤的內容

4另附xpath基本語法:http://www.w3school.com.cn/xpath/xpath_syntax.asp

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章