錯誤類型分析:
IndexError: list index out of range
1
情況一:
list[index]中的index下標超出範圍了,所以出現了訪問越界;
情況二:
list本身就是一個空的,沒有一個元素,所以當訪問到list[0]的時候,就會出現該錯誤。
實例代碼分析:
import re
import requests
from bs4 import BeautifulSoup
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
url = 'http://www.360doc.com/content/15/0408/11/22483181_461495582.shtml'
response = requests.get(url=url, headers=headers)
response.encoding = 'utf-8'
soup = BeautifulSoup(response.text, 'lxml')
p = soup.find_all('p')
for i in p[7:-9]:
if ':' in i.get_text():
result = re.findall('、(.*?): ', i.get_text()) //list出現問題
name = result[0].replace('二隊隊長', '').replace('"神漢"', '').replace('地主', '').strip()
with open('name.txt', 'a+') as f:
f.write(name + '\n')
f.close()
解決辦法:
在加註釋的後面加一句print (result)
將list的結果打印出來看是都list爲空。
結果發現list爲空,後來發現是result = re.findall('、(.*?): ', i.get_text())裏邊的標點符號有問題,中文的:打成了英文的:,因此導致result爲空。
result = re.findall('、(.*?):', i.get_text())
即解決了該問題。