這裏先說兩個.
1.取子標籤中的最後一個標籤,或者倒數的標籤。
場景:標籤數量會變動,但是順序始終是倒數第一個或者倒數幾個的情況:
td_list = html.xpath('/html/body/center[3]/table/tbody/tr/td/span/center/center[last()]/table/tbody/tr/td')
2.取某個標籤下面的所有文本。
場景:想取某個標籤下面的所有文本,如果僅僅用/text()只能取到這個標籤裏面暴露在外無標籤的文本。
如果這個標籤裏面還有p,span等標籤,那這些字就取不到了。此時果斷放棄text()方法:
html.xpath('string(/html/body/table/tbody/tr/td[2])')
試試string(path),path不帶text()
理論上//text()也可以。注意是兩條槓,不是一條。兩條表示取下面所有的,不考慮位置