xpath的高級用法

這裏先說兩個.

 

1.取子標籤中的最後一個標籤,或者倒數的標籤。

場景:標籤數量會變動,但是順序始終是倒數第一個或者倒數幾個的情況:

td_list = html.xpath('/html/body/center[3]/table/tbody/tr/td/span/center/center[last()]/table/tbody/tr/td')

2.取某個標籤下面的所有文本。

場景:想取某個標籤下面的所有文本,如果僅僅用/text()只能取到這個標籤裏面暴露在外無標籤的文本。

如果這個標籤裏面還有p,span等標籤,那這些字就取不到了。此時果斷放棄text()方法:

html.xpath('string(/html/body/table/tbody/tr/td[2])')

試試string(path),path不帶text()

理論上//text()也可以。注意是兩條槓,不是一條。兩條表示取下面所有的,不考慮位置

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章