urllib异常处理
urllib的error模块定义了由 request模块产生的异常。如果出现了问题,request 模块便会抛出error模块中定义的异常。
1 URLError
URLError类来自urllib库的error模块,它继承自OSError类,是error异常模块的基类,由 request模块生的异常都可以通过捕获这个类来处理
它具有一个属性reason,即返回错误的原因。
实例:
from urllib import request, error
try:
response = request.urlopen('https://py3study111.com')
except error.URLError as e:
print(e.reason)
打开一个不存在的域名,按理来说应该会报错,但是捕获了URLError异常后,运行结果为:
程序没有直接报错,而是输出了上面的内容,通过异常的捕获,可以避免程序的异常终止,还可以直观地看见错误信息,方面处理
2 HTTPError
它是URLError的子类,专门用来处理HTTP请求错误,比如认证请求失败等,有三个属性。
code:返回HTTP状态码,比如404表示网页不存在,500表示服务器内部错误等。
reason:同父类一样,用于返回错误的原因。
headers:返回请求头。
实例:
from urllib import request, error
try:
response = request.urlopen('http://www.dagouzi.cn/111.html')
except error.HTTPError as e:
print(e.reason, e.code, e.headers, sep='\n')
运行结果:
注释:访问一个网站不存在的页面,捕获了HTTPError异常,输出了reason,code和headers属性
因为URLError是HTTPError的父类,所以可以先选择捕获子类的错误,再去捕获父类的错误,更好的写法如下:
from urllib import request, error
try:
response = request.urlopen('http://www.dagouzi.cn/111.html')
except error.HTTPError as e:
print(e.reason, e.code, e.headers, sep='\n')
except error.URLError as e:
print(e.reason)
else:
print('Request Successfully')
注释:这样可以做到先捕获HTTPError,获取它的错误状态码,错误信息,headers信息。如果不是HTTPError异常,就会捕获URLError异常,输出错误原因。最后,用else来处理逻辑。
有时候,reason属性返回的不一定是字符串,也可能是一个对象
实例:
import socket
import urllib.request
import urllib.error
try:
response = urllib.request.urlopen('https://www.baidu.com', timeout=0.01)
except urllib.error.URLError as e:
if isinstance(e.reason, socket.timeout):
print('Time out')
运行结果:
Time out
注释:直接设置超时时间来强制抛出timeout异常,reason属性的结果是socket.timeout类,这里使用isinstance()方法来判断它的类型,做出更详细的异常判断。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341