這篇文章主要介紹了Python BeautifulSoup [解決方法] TypeError: list indices must be integers or slices, not str,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨着小編來一起學習學習吧
在python的Beautiful Soup 4 擴展庫的使用過程中出現了
TypeError: list indices must be integers or slices, not str
這個錯誤,這裏就分析一下爲什麼會報錯以及如何解決。
這個錯誤的意思是’類型錯誤:list的索引必須是’integers’或者’slices’不能是’str’
我出現錯誤的代碼:
#引入庫
from bs4 import BeautifulSoup
#讀取頁面
soup = BeautifulSoup(open('index.html'))
#獲取標籤
img_tag = div.select("img")
#獲取標籤屬性(這裏報錯)
src = img_tag['src']
#輸出
print(src)
經過檢查對比後我發現錯誤原因
就是獲取標籤時獲取的是list數據而不是tag
主要原因如下:
主要就是獲取的內容和自己認爲的有偏差。
也就是find()和find_all(),select()和select_one()的區別。
當使用
find()
select_one()
時,獲得的是一個標籤
類型爲
<class 'bs4.element.Tag'>
所以可以使用tag[‘class’]取值
當使用
find_all()
select()
時,獲得的是組標籤(就算只有一個標籤也是一組)
類型爲
#find_all()的返回值類型
<class 'bs4.element.ResultSet'>
#select()的返回值類型
<class 'list'>
這時,我們要取值就需要先定位是list(ResultSet)中的那個標籤在取值
例如tag[0][‘class’]
解決方法
方法一:
#引入庫
from bs4 import BeautifulSoup
#讀取頁面
soup = BeautifulSoup(open('index.html'))
#獲取標籤
img_tag = div.select("img")
#獲取標籤屬性(這裏有改動)
src = img_tag[0]['src']
#輸出
print(src)
因爲我知道頁面中的結構可以確保獲得的第一個bag爲我需要的標籤。
所以使用src = img_tag[0][‘src’]來獲取屬性信息。
方法二:
#引入庫
from bs4 import BeautifulSoup
#讀取頁面
soup = BeautifulSoup(open('index.html'))
#獲取標籤
img_tag = div.select_one("img")
#獲取標籤屬性(這裏有改動)
src = img_tag['src']
#輸出
print(src)
同上理,這樣修改也是可以成功的。
推薦我們的Python學習扣qun:774711191 ,看看前輩們是如何學習的!從基礎的python腳本到web開發、爬蟲、django、數據挖掘等【PDF,實戰源碼】,零基礎到項目實戰的資料都有整理。送給每一位python的小夥伴!每天都有大牛定時講解Python技術,分享一些學習的方法和需要注意的小細節,點擊加入我們的 python學習者聚集地
出現這種問題還是因爲自己不用心,還是要時刻提醒自己。