python xpath 提取html 中使用分割的文本

文本格式形如:

<div class="tip">
1、荷蘭豆汆燙變色即可,千萬不要過火,時間也就是幾秒鐘。
<br>
2、我用的臘腸肥肉較多,所以炒這道菜根本不用油。
<br>
3、喜歡荷蘭豆的本味兒,就沒放蔥、姜、花椒,可加少許蒜片提香。
<br>
4、荷蘭豆炒的時候也不要過火,荷蘭豆纔會脆嫩。
</div>

提取代碼:

tips_lst = []
lst = page.xpath('//div/div')
#提取 1、荷蘭豆汆燙變色即可,千萬不要過火,時間也就是幾秒鐘。
print lst[0].text
#依次提取 2, 3, 4
lst = page.xpath('//div/div[@class="tip"]/br')
for ll in lst:
    print ll.tail
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章