Python BeautifulSoup [解決方法] TypeError: list indices must be integers or slices, not str

這篇文章主要介紹了Python BeautifulSoup [解決方法] TypeError: list indices must be integers or slices, not str,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨着小編來一起學習學習吧
在python的Beautiful Soup 4 擴展庫的使用過程中出現了

TypeError: list indices must be integers or slices, not str

這個錯誤,這裏就分析一下爲什麼會報錯以及如何解決。

這個錯誤的意思是’類型錯誤:list的索引必須是’integers’或者’slices’不能是’str’

我出現錯誤的代碼:

#引入庫
from bs4 import BeautifulSoup
#讀取頁面
soup = BeautifulSoup(open('index.html'))
#獲取標籤
img_tag = div.select("img")
#獲取標籤屬性(這裏報錯)
src = img_tag['src']
#輸出
print(src)

經過檢查對比後我發現錯誤原因

就是獲取標籤時獲取的是list數據而不是tag

主要原因如下:
主要就是獲取的內容和自己認爲的有偏差。

也就是find()和find_all(),select()和select_one()的區別。
當使用

find()
select_one()

時,獲得的是一個標籤
類型爲

<class 'bs4.element.Tag'>

所以可以使用tag[‘class’]取值

當使用

find_all()
select()

時,獲得的是組標籤(就算只有一個標籤也是一組)
類型爲

#find_all()的返回值類型
<class 'bs4.element.ResultSet'>
#select()的返回值類型
<class 'list'>

這時,我們要取值就需要先定位是list(ResultSet)中的那個標籤在取值
例如tag[0][‘class’]

解決方法
方法一:

#引入庫
from bs4 import BeautifulSoup
#讀取頁面
soup = BeautifulSoup(open('index.html'))
#獲取標籤
img_tag = div.select("img")
#獲取標籤屬性(這裏有改動)
src = img_tag[0]['src']
#輸出
print(src)

因爲我知道頁面中的結構可以確保獲得的第一個bag爲我需要的標籤。
所以使用src = img_tag[0][‘src’]來獲取屬性信息。

方法二:

#引入庫
from bs4 import BeautifulSoup
#讀取頁面
soup = BeautifulSoup(open('index.html'))
#獲取標籤
img_tag = div.select_one("img")
#獲取標籤屬性(這裏有改動)
src = img_tag['src']
#輸出
print(src)

同上理,這樣修改也是可以成功的。

推薦我們的Python學習扣qun:774711191 ,看看前輩們是如何學習的!從基礎的python腳本到web開發、爬蟲、django、數據挖掘等【PDF,實戰源碼】,零基礎到項目實戰的資料都有整理。送給每一位python的小夥伴!每天都有大牛定時講解Python技術,分享一些學習的方法和需要注意的小細節,點擊加入我們的 python學習者聚集地

出現這種問題還是因爲自己不用心,還是要時刻提醒自己。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章