Python常见错误:IndexError: list index out of range解决
短信预约 -IT技能 免费直播动态提醒
报错代码
粉丝群里面的一个小伙伴想用requests爬虫,然后遍历Xpath定位的数据列表的时候,发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴),报错代码如下:
import requests
from lxml import etree
text = requests.get("https://www.baidu.com").content.decode()
html = etree.HTML(text)
div_divst = html.xpath("//div")
for div in div_divst:
title = div.xpath("@title")[0]
url = div.xpath("@url")[0]
报错信息如下:
IndexError: list index out of range
报错翻译
报错信息翻译:
索引错误:列表索引超出范围
报错原因
list index out of range错误出现的原因主要有两个:
- 一个可能是下标超出范围
- 一个可能是list是空的,没有一个元素
粉丝的爬虫代码中明显是因为Xpath没有定位到数据,所以list为空,list[0]就会报错。小伙伴们按下面的方法解决即可!!!
解决方法
用异常捕获Xpath定位,当报错的时候捕获异常并把title和url赋值为None:
import requests
from lxml import etree
text = requests.get("https://www.baidu.com").content.decode()
html = etree.HTML(text)
div_divst = html.xpath("//div")
for div in div_divst:
try:
title = div.xpath("@title")[0]
url = div.xpath("@url")[0]
except:
title = None
url = None
帮忙解决
总结
到此这篇关于Python常见错误:IndexError: list index out of range解决的文章就介绍到这了,更多相关Python IndexError: list index out of range内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341