數據採集時,多個同類型網頁上字段種類、數量可能不一致。有時需要我們判斷該字段是否在網頁上,使用xpath可以用標籤包含某個文本的方式。
部分代碼如下:
在不知道Checks for plagiarism字段是否存在的情況下,可以用
try:
pq = doc.xpath("//p[contains(text(),'Checks for plagiarism')]")[0]
except Exception as e:
pq = ''
數據採集時,多個同類型網頁上字段種類、數量可能不一致。有時需要我們判斷該字段是否在網頁上,使用xpath可以用標籤包含某個文本的方式。
部分代碼如下:
在不知道Checks for plagiarism字段是否存在的情況下,可以用
try:
pq = doc.xpath("//p[contains(text(),'Checks for plagiarism')]")[0]
except Exception as e:
pq = ''