錯誤類型分析: IndexError: list index out of range

錯誤類型分析:

IndexError: list index out of range
1

情況一: 
list[index]中的index下標超出範圍了,所以出現了訪問越界;

情況二: 
list本身就是一個空的,沒有一個元素,所以當訪問到list[0]的時候,就會出現該錯誤。

實例代碼分析:
import re
import requests
from bs4 import BeautifulSoup

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
url = 'http://www.360doc.com/content/15/0408/11/22483181_461495582.shtml'
response = requests.get(url=url, headers=headers)
response.encoding = 'utf-8'
soup = BeautifulSoup(response.text, 'lxml')
p = soup.find_all('p')
for i in p[7:-9]:
    if ':' in i.get_text():
        result = re.findall('、(.*?): ', i.get_text()) //list出現問題
        name = result[0].replace('二隊隊長', '').replace('"神漢"', '').replace('地主', '').strip()
        with open('name.txt', 'a+') as f:
            f.write(name + '\n')
        f.close()
解決辦法:
在加註釋的後面加一句print (result)
將list的結果打印出來看是都list爲空。
結果發現list爲空,後來發現是result = re.findall('、(.*?): ', i.get_text())裏邊的標點符號有問題,中文的:打成了英文的:,因此導致result爲空。
 result = re.findall('、(.*?):', i.get_text())
即解決了該問題。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章