requests模块使用
短信预约 -IT技能 免费直播动态提醒
安装 requests
# 在命令行工具中使用pip install requests# 使用前需要导入import requests
下面我们来看一下requests库的几种常用高级用法
会话对象
- 会话对象可以跨请求保持某些参数,在同一个 Session 实例发出的所有请求之间保持 cookie,会话也可用来为请求方法提供缺省的数据;
from requests import Sessions = Session()# 会话拿到r = s.get('http://www.baidu.com')print(r) # <Response [200]>print(r.cookies) # <RequestsCookieJar[<Cookie BDORZ=27315 for .baidu.com/>]># 再次发起请求r = s.get('https://www.csdn.net/')print(r.text)
我们可以拿到一个名为 r
的 Response 对象,然后在这个对象中获取所有我们想要的信息,大家可以自己执行代码看看输出结果。
- 会话还可以作为上下文管理器,这样就能确保 with 区块退出后即使发生了异常会话能被关闭;
import requestswith requests.get('http://httpbin.org/get', stream=True) as r: print(r.text)
- 任何时候进行了类似
requests.get()
的调用,都在做两件主要的事情,一个是在构建一个 Request 对象, 该对象将被发送到某个服务器请求或查询一些资源,其二是一旦 requests 得到一个从服务器返回的响应就会产生一个 Response 对象。该响应对象包含服务器返回的所有信息,也包含你原来创建的 Request 对象;
使用Prepared Request对象
- 当你从 API 或者session会话调用中收到一个 Response 对象时,request 属性其实是使用了
Prepared Request
对象。
from requests import Request, Sessions = Session()# 获取Prepared Request对象req = Request('GET', url, data=data, headers=header)prepped = req.prepare()# do something with prepped.body# do something with prepped.headersresp = s.send(prepped, stream=stream, verify=verify, proxies=proxies, cert=cert, timeout=timeout)print(resp.status_code)
SSL 证书验证
- Requests 可以为 HTTPS 请求验证 SSL 证书,就像 web 浏览器一样。verify 默认参数就是true,开启SSL 验证,如果将 verify 设置为 False,则会忽略对 SSL 证书的验证,但是会有警告,需要使用
urllib3.disable_warnings()
;
import requestsimport urllib3urllib3.disable_warnings()# verify默认参数就是trueret = requests.get('https://github.com', verify=True)print(ret.status_code)# 也可以关闭verify, 但是会有警告ret = requests.get('https://github.com', verify=False)print(ret.status_code)
流式上传
- Requests支持流式上传,允许发送大的数据流或文件而无需先把它们读入内存,要使用流式上传,需要为请求体提供一个类文件对象;
with open('massive-body', 'rb') as f: requests.post('http://some.url/streamed', data=f)与requests.post("http://httpbin.org/post", files=files)不一样
块编码请求
- 当下载大文件时,用
Response.iter_content
或许更方便些。requests.get(url)
默认是下载在内存中的,下载完成才存到硬盘上,可以用Response.iter_content
来边下载边存
import requestsurl = "http://DOMAIN/media/1.mp4"# 这里设置stream=true的目的在于不会将内容全部储存在内存中,而是根据chunk_size的大小,去下载内容ret = requests.get(url, stream=True)with open('1.mp4', 'wb') as f: for block in ret.iter_content(chunk_size=1024): f.write(block)
POST 多个分块编码的文件
- 使用POST表单提交的方式可以在一个请求中发送多个文件,只需要把文件设到一个元组的列表中。
例如,假设你要上传多个图像文件到一个 HTML 表单,使用一个多文件 field 叫做 “images”:
<input type="file" name="images" multiple="true" required="true"/>
然后把文件设到一个元组的列表中,其中元组结构为 (form_field_name, file_info):
import requestsurl = 'http://httpbin.org/post'multiple_files = [ # images是input的name属性 ('images', ('foo.png', open('foo.png', 'rb'), 'image/png')), ('images', ('bar.png', open('bar.png', 'rb'), 'image/png'))]r = requests.post(url, files=multiple_files)print(r.text)
设置Proxy代理
- 如果需要使用代理,可以通过为任意请求方法提供 proxies 参数来往请求中设置代理,还可以传递用户名和密码;
import requests#普通代理proxies = { "http": "http://23.10.1.10:80", "https": "https://23.10.1.11:80",}# 往请求中设置代理(proxies)r = requests.get("https://www.baidu.com", proxies=proxies)print(r.status_code)# 带有用户名和密码的代理, basic认证proxies = { "http": "http://user:password@227.1.0.1:9999/",}r = requests.get("https://www.baidu.com", proxies=proxies)print(r.status_code)# 设置socks代理proxies = { 'http': 'socks5://127.0.0.1:1080', 'https': 'socks5://127.0.0.1:1080'}r = requests.get("https://www.facebook.com", proxies=proxies)print(r.status_code)
参考:https://www.9xkd.com/user/plan-view.html?id=3940257785
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
requests模块使用
下载Word文档到电脑,方便收藏和打印~
下载Word文档
猜你喜欢
requests模块使用
安装 requests# 在命令行工具中使用pip install requests# 使用前需要导入import requests下面我们来看一下requests库的几种常用高级用法会话对象会话对象可以跨请求保持某些参数,在同一个 Ses
2023-06-02
Python3使用requests模块显
1. 相关资料请求关键参数:stream=True。默认情况下,当你进行网络请求后,响应体会立即被下载。你可以通过 stream 参数覆盖这个行为,推迟下载响应体直到访问 Response.content 属性。tarball_url =
2023-01-31
Python requests模块怎么使用
本文小编为大家详细介绍“Python requests模块怎么使用”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python requests模块怎么使用”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。1.准备工
2023-07-05
2024-04-02
2023-05-14
如何使用Requests模块抓取网页
这篇文章主要介绍“如何使用Requests模块抓取网页”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“如何使用Requests模块抓取网页”文章能帮助大家解决问题。爬取网页其实就是通过URL获取网页信
2023-07-06
2023-09-20
2023-10-20
python requests模块详解
requests是python的一个HTTP客户端库,跟urllib,urllib2类似,那为什么要用requests而不用urllib2呢?官方文档中是这样说明的: python的标准库urllib2提供了大部分需要的HTTP功能,但是A
2023-01-31
python中requests模块怎么用
这篇文章将为大家详细讲解有关python中requests模块怎么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。Requests模块是一个用于网络请求的模块,主要用来模拟浏览器发请求。其实类似的模块有很
2023-06-29
详解Python requests模块
前言
虽然Python的标准库中 urllib2 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 “HTTP for Humans”,说明使用更简洁方便。
Requests 继承
2022-06-02
2023-09-04
Python使用lxml模块和Requests模块抓取HTML页面的教程
Web抓取
Web站点使用HTML描述,这意味着每个web页面是一个结构化的文档。有时从中 获取数据同时保持它的结构是有用的。web站点不总是以容易处理的格式, 如 csv 或者 json 提供它们的数据。
这正是web抓取出场的时机。We
2022-06-04
python模块requests的安装
1.到requests的官网下载包,2.取包名为requests-2.12.4.tar.gz下载并解压到本地3.cmd,切换到其目录下,python setup.py install4.cmd,python,import requests,
2023-01-31
2024-04-02
python3-使用requests模拟
# -*- coding: utf-8 -*-from Crypto.Cipher import AESimport base64import randomimport codecsimport requestsfrom fake_user
2023-01-31
python的requests模块实现登
51cto用python的requests模块实现登陆示例代码如下:-- coding:utf-8 --import requestsimport reclient = requests.session()agent = "Mozilla/
2023-01-31
2023-09-04
2023-09-03
2024-04-02