错误类型分析: IndexError: list index out of range

错误类型分析:

IndexError: list index out of range
1

情况一: 
list[index]中的index下标超出范围了,所以出现了访问越界;

情况二: 
list本身就是一个空的,没有一个元素,所以当访问到list[0]的时候,就会出现该错误。

实例代码分析:
import re
import requests
from bs4 import BeautifulSoup

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
url = 'http://www.360doc.com/content/15/0408/11/22483181_461495582.shtml'
response = requests.get(url=url, headers=headers)
response.encoding = 'utf-8'
soup = BeautifulSoup(response.text, 'lxml')
p = soup.find_all('p')
for i in p[7:-9]:
    if ':' in i.get_text():
        result = re.findall('、(.*?): ', i.get_text()) //list出现问题
        name = result[0].replace('二队队长', '').replace('"神汉"', '').replace('地主', '').strip()
        with open('name.txt', 'a+') as f:
            f.write(name + '\n')
        f.close()
解决办法:
在加注释的后面加一句print (result)
将list的结果打印出来看是都list为空。
结果发现list为空,后来发现是result = re.findall('、(.*?): ', i.get_text())里边的标点符号有问题,中文的:打成了英文的:,因此导致result为空。
 result = re.findall('、(.*?):', i.get_text())
即解决了该问题。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章