python 根據中文表頭標題抓取動態(表格)文檔數據

思路

如圖左側表頭標題,要獲得右側數據。網頁數據提取成漢字,表格數據間會有空格,用split()分隔成list。用index()查找某個漢字表頭位置,輸出list下一個位置既是要得到值

    text2 ='網頁純文本,爬蟲數據自己轉換'
    # 字符串分割成列表,Python 分割字符串使用 變量.split("分割標示符號"[分割次數]),分割次數表示分割最大次數,爲空則分割所有。
    list2 = text2.split()
    #列表根據內容查找某個值的位置,list2爲列表的名字,p是查找的值在list的位置
    p = list2.index('查找的值,如管理規模區間')
    # v就是要獲取的值,如20-50億元
    v = list2[p + 1]  

  

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章