我的编程空间,编程开发者的网络收藏夹
学习永远不晚

python之web模块学习-- htt

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

python之web模块学习-- htt


1  httplib简介

httplib 是python中http协议的客户端实现,可以使用该模块来与 HTTP 服务器进行交互

    httplib是一个相对底层的http请求模块,其上有专门的包装模块,如urllib内建模块,goto等第三方模块,但是封装的越高就越不灵活,比如urllib模块里请求错误时就不会返回结果页的内容,只有头信息,对于某些需要检测错误请求返回值的场景就不适用,所以就得用这个模块了。

    httplib实现了HTTP和HTTPS的客户端协议,一般不直接使用,在python更高层的封装模块中(urllib,urllib2)使用了它的HTTP和HTTPS实现。其中HTTPS需要socket编译了SSL支持。HTTP类仅仅是和python1.5.2及以前的版本兼容,不推荐使用。

    2 httplib 详解

下面介绍一下 httplib常用的类

    2.1 class httplib.HTTPConnection

       HTTPConnection类 有两种常见方式:

     1 HTTPConnection

    class httplib.HTTPConnection(host[,port[, strict[, timeout[, source_address]]]]) 
用法:
    该类用于创建一个http类型的请求链接
参数:
    host: 请求的服务器host,不能带http://开头
    port: 服务器web服务端口
    strict: 是否严格检查请求的状态行,就是http1.0/1.1 协议版本的那一行,即请求的第一行,默认为False,为True时检查错误会抛异常
    timeout: 单次请求的超时时间,没有时默认使用httplib模块内的全局的超时时间
返回:
    HTTPConnection类会实例并返回一个HTTPConnection对象
详解:
    HttpConnection的实例表示与HTTP服务器的事务。实例化时需要传递主机和可选的端口号。如果没有端口号,试图以host:port格式从主机字符串提取,如果提取失败则使用默认的HTTP端口(80)。参数strict默认为false,表示在无法解析状态行时(status line)不能被HTTP/1.0或1.1解析时不抛出BadStatusLine异常;可选参数timeout表示即阻塞在多少秒后超时,如果没有给出默认使用全局超时设置。可选参数source_address表示HTTP的源地址(host, port)。

    2 HTTPSConnection

    class httplib.HTTPSConnection(host[, port[, key_file[,cert_file[, strict[, timeout[, source_address]]]]]])
用法:
    该类用于创建一个https类型的请求链接
参数:
    key_file:一个包含PEM格式的私钥文件
    cert_file:一个包含PEM格式的认证文件
    other:其它同http参数
返回:
    同样返回一个HTTPSConnection对象
注意:
    要创建https链接,必须要保证底层的socket模块是支持ssl的编译模式,即编译时ssl选项的开关是开着的
详解:
   HttpConnection的子类,使用SSL与安全服务器通信。默认端口为443。key_file是包含PEM格式私钥的文件名称。 cert_file中是PEM格式的证书链文件。

附代码:

HTTP:

>>> import httplib
>>> conn =httplib.HTTPConnection('www.baidu.com')
>>> conn = httplib.HTTPConnection('www.baidu.com:80')
>>> conn =httplib.HTTPConnection('www.baidu.com','80')
>>> conn =httplib.HTTPConnection('www.baidu.com','80',True)
>>> conn =httplib.HTTPConnection('www.baidu.com','80',True,10)

    错误示例:

>>> conn =httplib.HTTPConnection('www.baidu.com:80',True,10)

HTTPS:

>>> conn = httplib.HTTPSConnection('www.baidu.com',443,key_file,cert_file,True,10)

    

    以下为 关于 HTTPConnection 类的方法

    2.1.1  HTTPConnection.request()

    HTTPConnection.request( method , url [ , body [ , headers ]] )
用法:
    调用request方法会向服务器发送一次请求
参数:
    method: 请求的方式,如'GET','POST','HEAD','PUT','DELETE'等
    url: 请求的网页路径。如:'/index.html'
    body: 请求是否带数据,该参数是一个字典
    headers: 请求是否带头信息,该参数是一个字典,不过键的名字是指定的http头关键字
返回:
    无返回,其实就是相对于向服务其发送数据,但是没有最后回车

附代码:

>>> import httplib
>>>conn=httplib.HTTPConnection('www.baidu.com',80,False,10)
>>> conn.request('get','/','',{'user-agent':'test'})

    2.1.2  HTTPConnection.getresponse()

说明:
    获取一个http响应对象,相当于执行最后的2个回车
返回:
    HTTPResponse对象(下面会用到)

附代码:

>>> import httplib
>>> conn=httplib.HTTPConnection('www.baidu.com',80,False,10)
>>> conn.request('get','/','',{'user-agent':'test'})
>>>res = conn.getresponse()

    2.1.3  HTTPConnection.connect()

    对象创建之后连接到指定的服务器

    2.1.4  HTTPConnection.close()

    关闭与服务器的连接    

    附代码:

>>> import httplib
>>> conn=httplib.HTTPConnection('www.baidu.com',80,False,10)
>>> conn.request('get','/','',{'user-agent':'test'})
>>> res = conn.getresponse()
>>>conn.close()

    2.1.5  HTTPConnection.set_debuglevel( level )

    设置高度的级别。参数level 的默认值为0 ,表示不输出任何调试信息


  2.2  class httplib.HTTPResponse

    HTTPResponse表示服务器对客户端请求的响应。往往通过调用HTTPConnection.getresponse()来创建,实例连接成功之后返回的类,不能由用户实例化。

    它有如下方法和属性:

    2.2.1  HTTPResponse.read([amt])

说明:
    获得http响应的内容部分,即网页源码
原型:
    body = res.read([amt])amt: 读取指定长度的字符,默认为空,即读取所有内容
返回:
    网页内容字符串

    获取响应的消息体。如果请求的是一个普通的网页,那么该方法返回的是页面的html。可选参数amt表示从响应流中读取指定字节的数据。

    附代码:

>>>conn=httplib.HTTPConnection('www.baidu.com',80,False,10)
>>> conn.request('GET','')
>>> res = conn.getresponse()
>>>res.read()
#下面的为网页信息
'<!DOCTYPE html><!--STATUSOK-->\r\n<html>\r\n<head>\r\n\t<metahttp-equiv="content-type"content="text/html;charset=utf-8">\r\n\t<metahttp-equiv="X-UA-Compatible" content="IE=Edge">\r\n\t<linkrel="dns-prefetch"href="//s1.bdstatic.com"/>\r\n\t<linkrel="dns-prefetch" href="//t1.baidu.com"/>\r\n\t<linkrel="dns-prefetch" href="//t2.baidu.com"

    2.2.2   HTTPResponse.getheader(name[, default])

    获取执指定的响应头。Name表示头域(headerfield)名,可选参数default在头域名不存在的情况下作为默认值返回。

    2.2.3   HTTPResponse.getheaders()

    获得所有的响应头内容,是一个元组列表[(name,value),(name2,value2)]


    附代码:

>>>res.getheaders()
[('content-length', '14613'), ('bdqid','0x9d3801010001675e'), ('set-cookie','BAIDUID=9ACDF7C2DF8C2EA720CBD97636829343:FG=1; expires=Thu, 31-Dec-37 23:55:55GMT; max-age=2147483647; path=/; domain=.baidu.com,BIDUPSID=9ACDF7C2DF8C2EA720CBD97636829343; expires=Thu, 31-Dec-37 23:55:55 GMT;max-age=2147483647; path=/; domain=.baidu.com, PSTM=1436858070; expires=Thu,31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com,BDSVRTM=0; path=/'), ('accept-ranges', 'bytes'), ('vary', 'Accept-Encoding'),('bduserid', '0'), ('server', 'BWS/1.1'), ('last-modified', 'Wed, 03 Sep 201402:48:32 GMT'), ('connection', 'Keep-Alive'), ('x-ua-compatible', 'IE=Edge,chrome=1'),('pragma', 'no-cache'), ('cache-control', 'no-cache'), ('date', 'Tue, 14 Jul2015 07:14:30 GMT'), ('p3p', 'CP=" OTI DSP COR IVA OUR IND COM "'),('content-type', 'text/html'), ('bdpagetype', '1')]

    2.2.4  HTTPResponse.msg

    获取所有的响应头信息。包含响应头的mimetools.Message实例

>>>res.msg
<httplib.HTTPMessage instance at0x1959e60>

    2.2.5  HTTPResponse.msg

    获取服务器所使用的http协议版本。11表示http/1.1;10表示http/1.0

>>> res.version
11

     2.2.6  HTTPResponse.status

    获取响应的状态码。如:200表示请求成功

>>> res.status
200

     2.2.6  HTTPResponse.reason

    返回服务器处理请求的结果说明。一般为”OK”

>>> res.reason
'OK'

  2.3  class httplib.HTTPMessage

    HTTPMessage实例用于保存HTTP响应头。它使用mimetools.Message类实现,并提供了处理HTTP头的工具函数。它不直接实例化的用户。不能由用户实例化。

  2.4  异常

    exception httplib.HTTPException

Exception的子类,此模块中的其他异常的基类。下面的类默认是该类的直接子类。

  • httplib.NotConnected

  • httplib.InvalidURL

  • httplib.UnknownProtocol

  • httplib.UnknownTransferEncoding

  • httplib.UnimplementedFileMode

  • httplib.IncompleteRead

  • httplib.ImproperConnectionState

  • httplib.CannotSendRequest

ImproperConnectionState的一个子类。

  • httplib.CannotSendHeader

ImproperConnectionState的一个子类。

  • httplib.ResponseNotReady

ImproperConnectionState的一个子类。

  • httplib.BadStatusLine

服务器返回的HTTP状态码不认识时产生。

  2.5  常量和类变量

  • httplib.HTTP_PORT:HTTP协议的默认端口,恒为80。

  • httplib.HTTPS_PORT:HTTPS协议的默认端口,恒为443。

  • 状态常量:参见http://docs.python.org/2/library/httplib.html

  • httplib.responses:映射HTTP1.1状态代码映射到W3C的名字的字典。




免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

python之web模块学习-- htt

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

python之web模块学习-- htt

1  httplib简介httplib 是python中http协议的客户端实现,可以使用该模块来与 HTTP 服务器进行交互    httplib是一个相对底层的http请求模块,其上有专门的包装模块,如urllib内建模块,goto等第
2023-01-31

python之web模块学习-- url

下面继续学习python的web模块 ---  urllib2,一个源于urllib又高于urllib的模块。1  urllib2 简介    urllib2是python自带的一个访问网页及本地文件的库。    与urllib相比,显著区
2023-01-31

Python模块学习之IPy模块

IP地址规划是网络设计中非常重要的一个环节,规划的好坏会直接影响路由协议算法的效率,包括网络性能、可扩展性等方面,在这个过程当中,免不了要计算大量的IP地址,包括网段、网络掩码、广播地址、子网数、IP类型等。Python提供了一个强大的第三
2023-01-31

python学习之argparse模块

一、简介:argparse是python用于解析命令行参数和选项的标准模块,用于代替已经过时的optparse模块。argparse模块的作用是用于解析命令行参数,例如 python parseTest.py input.txt outpu
2023-01-31

Python学习之PyYaml模块

我需要解析twemproxy的配置文件中的pool和后端的redis主机。采用shell解析yml文件太麻烦,正好python有正对于yaml文件解析的pyyaml模块例如twemporxy的配置文件nutcracker.yamlalpha
2023-01-31

python模块之paramiko学习<

简介:paramiko是python(2.2或更高)的模块,遵循SSH2协议实现了安全(加密和认证)连接远程机器。安装所需软件包:http://ftp.dlitz.net/pub/dlitz/crypto/pycrypto/pycrypto
2023-01-31

Python学习之MySQLdb模块

CentOS下安装sudo yum install MySQL-python可以参考http://www.mikusa.com/python-mysql-docs/index.html  获取更多信息MySQL-python 为Python
2023-01-31

Python学习笔记之json模块和pickle模块

json和pickle模块是将数据进行序列化处理,并进行网络传输或存入硬盘,下面这篇文章主要给大家介绍了关于Python学习笔记之json模块和pickle模块的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
2023-05-18

小白学习Python之路---re模块学

本节大纲:  1.正则表达式  2.re模块的学习  3.速记理解技巧  4.挑战练习--开发一个简单的python计算器  5.心得总结  6.学习建议  正则表达式:  正则表达式,又称规则表达式。(英语:Regular Express
2023-01-31

python模块学习----nmap模块

安装nmap模块:pip install python_nmanmap模块说明:python-nmap是一个帮助使用nmap端口扫描器的python库。它允许轻松操纵nmap扫描结果,并且将是一个完美的选择,为需要自动完成扫描任务的系统管理
2023-01-31

Python 模块学习

模块学习:http://wsyht90.blog.51cto.com/9014030/18457371、getpass2、os3、sys4、subprocess5、hashlib6、json7、pickle8、shutil9、time10、
2023-01-31

python模块学习

系统相关的信息模块: import syssys.argv 是一个 list,包含所有的命令行参数. sys.stdout sys.stdin sys.stderr 分别表示标准输入输出,错误输出的文件对象. sys.stdin
2023-01-31

python学习-psuti模块

psutil(进程和系统实用程序)是一个跨平台的库,用于 在Python中检索有关运行进程和系统利用率(CPU,内存,磁盘,网络,传感器)的信息。它主要用于系统监视,分析和限制流程资源以及运行流程的管理。它实现了UNIX命令行工具提供的许多
2023-01-31

Python pycurl模块 学习

pycurl模块的安装方法如下:easy_install pycurl #easy_install安装方法pip install pycurl #pip安装方法#源码安装方法# 要求curl-config包支持,需要源码方式重新安装curl
2023-01-31

Python学习-pycurl模块

pycurl是一个用c语言编写的libcurl Python实现,功能非常强大,支持操作协议有FTP,HTTP,HTTPS,TELNET等。模块的常用方法说明:close()方法,对应libcurl包中的curl_easy_cleanup方
2023-01-31

python学习-smtplib模块

python的stmplib模块可以实现邮件的发送功能,可以模拟一个smtp客户端。在python2.3或者更高版本默认自带smtplib模块,无需额外安装。一、smtplibi模块的常用类与方法    smtp类定义:smtplib([h
2023-01-31

python学习-re模块

Python 的 re 模块(Regular Expression 正则表达式)提供各种正则表达式的匹配操作,在文本解析、复杂字符串分析和信息提取时是一个非常有用的工具,下面我主要总结了re的常用方法。1.re的简介    使用python
2023-01-31

python optparse模块学习

本文参考:http://docs.python.org/2/library/optparse.htmlPython 有两个内建的模块用于处理命令行参数:一个是 getopt,getopt只能简单处理 命令行参数。另一个是 optparse,
2023-01-31

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录