文本格式形如:
<div class="tip">
1、荷蘭豆汆燙變色即可,千萬不要過火,時間也就是幾秒鐘。
<br>
2、我用的臘腸肥肉較多,所以炒這道菜根本不用油。
<br>
3、喜歡荷蘭豆的本味兒,就沒放蔥、姜、花椒,可加少許蒜片提香。
<br>
4、荷蘭豆炒的時候也不要過火,荷蘭豆纔會脆嫩。
</div>
提取代碼:
tips_lst = []
lst = page.xpath('//div/div')
#提取 1、荷蘭豆汆燙變色即可,千萬不要過火,時間也就是幾秒鐘。
print lst[0].text
#依次提取 2, 3, 4
lst = page.xpath('//div/div[@class="tip"]/br')
for ll in lst:
print ll.tail