我的编程空间,编程开发者的网络收藏夹
学习永远不晚

网页Cookie如何获取

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

网页Cookie如何获取

这篇文章主要讲解了“网页Cookie如何获取”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“网页Cookie如何获取”吧!

这里采用python2.7

第一种:mechanize

首先我们要使用mechanize,第一步:

pip install mechanize

第二步编写获取cookie代码:

import osimport mechanizeimport cookielib,rebr = mechanize.Browser()cj = cookielib.LWPCookieJar()br.set_cookiejar(cj)br.set_handle_equiv(True)br.set_handle_gzip(True)br.set_handle_redirect(True)br.set_handle_referer(True)br.set_handle_robots(False)br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)br.set_debug_http(True)br.addheaders = [('User-agent', '用户ua')]br.set_proxies({"http": "代理"})response = br.open('https://www.amazon.com')cj = br._ua_handlers['_cookies'].cookiejarfor cookie in cj:    print("cookieName:"+cookie.name)    print("cookieValue:"+cookie.value)cookie = [item.name + ":" + item.value for item in cj]cookiestr={}for item in cookie:    name,value = item.split(":")    cookiestr[name]=value

运行结果:

网页Cookie如何获取

第二种:urllib

import urllib2import cookielibfrom http import cookiejarfrom bs4 import BeautifulSoupUser_Agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'header = {}header['User-Agent'] = User_Agentcookie = cookiejar.CookieJar()cookie_handle=urllib2.HTTPCookieProcessor(cookie)cookie_opener = urllib2.build_opener(cookie_handle)# proxy_support = urllib2.ProxyHandler({"http":"5.62.157.47:8085"})# proxy_opener = urllib2.build_opener(proxy_support)urllib2.install_opener(cookie_opener)# urllib2.install_opener(proxy_opener)request = urllib2.Request("https://www.amazon.com",headers=header)response = urllib2.urlopen(request)for item in cookie:    print('Name = ' +item.name)    print('Value =' +item.value)

运行结果:

网页Cookie如何获取

第三种:requests

import requestsheaders = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}r = requests.get('https://www.amazon.com', headers = headers)for cookie in r.cookies:    print(cookie.name)    print(cookie.value)    print("=========")

运行结果:

网页Cookie如何获取

第四种:selenium(个人感觉这个虽然加载比较慢,但是获取cookie最全)

pip install selenium

代码:

from selenium import webdriverdriver = webdriver.Chrome(executable_path='d:/seop/chromedriver.exe')driver.get("https://www.amazon.com")#for c in cookiestr.keys():#    driver.add_cookie({'name':c,'value':cookiestr[c]})#driver.get("https://www.amazon.com")cookie = [item["name"] + "=" + item["value"] for item in driver.get_cookies()]cookiestr = ';'.join(item for item in cookie)

运行结果:

网页Cookie如何获取

第五种:总觉得selenium比较慢,打开还要加载浏览器,于是尝试了 htmlunit以及phantomjs

htmlunit

网页Cookie如何获取

phantomjs

from selenium import webdriverbrowser = webdriver.PhantomJS()browser.get("https://www.amazon.com")cookie = [item["name"] + "=" + item["value"] for item in browser.get_cookies()]cookiestr = ';'.join(item for item in cookie)

运行结果:

网页Cookie如何获取

第六种:scrapy

这边我们简单测试一下,首先你电脑已经要安装了scrapy,如果没有安装,pip install scrapy

然后我们输入要获取地址的cookie

scrapy shell "https://www.amazon.com"

cookie结果:

网页Cookie如何获取

最后一种:chrome headless 使用无头浏览器来获取

这个目前我是在centos上面进行操作:

第一步:肯定你要安装chrome啦

第二步:运行安装脚本

curl https://intoli.com/install-google-chrome.sh | bash

测试是否成功: 运行以下命令,如果成功会在当前目录下面保存百度的截图

google-chrome-stable --no-sandbox --headless --disable-gpu --screenshot     https://www.baidu.com

这里我们开始获取cookie信息

first:

google-chrome-stable --no-sandbox --headless --disable-gpu --user-data-dir="$HOME/Library/Application Support/Google/Chrome/" --remote-debugging-port=9222  https://www.amazon.com

second: 这里我们主要是获取websocket的url

curl -s localhost:9222/json

网页Cookie如何获取

third: 这边要注意哦,要安装wsc,安装wsc之前记得要安装npm哦,然后在执行npm install -g wsc,然后在执行以下命令

wsc ws://localhost:9222/devtools/page/D42AFC3C9AF9C8A1511ADC60850BD5A8

然后输入:

{"id": 1, "method": "Network.getAllCookies"}

最后cookie结果:

网页Cookie如何获取

目前尝试了mechanize、urllib、selenium、headless chrome、requests、htmlunit、phantomjs、scrapy

目前已经尝试了以上八种,觉得还是selenium获取cookie比较全,信息比较完整,获取cookie的字段也是比较稳定的,经过研究cookie,就是selenium获取cookie的速度比较慢,看看还有没啥办法优化速度,继续查阅别的方式来获取cookie。

感谢各位的阅读,以上就是“网页Cookie如何获取”的内容了,经过本文的学习后,相信大家对网页Cookie如何获取这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是编程网,小编将为大家推送更多相关知识点的文章,欢迎关注!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

网页Cookie如何获取

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

网页Cookie如何获取

这篇文章主要讲解了“网页Cookie如何获取”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“网页Cookie如何获取”吧!这里采用python2.7第一种:mechanize首先我们要使用me
2023-06-26

php如何获取cookie值

本篇内容主要讲解“php如何获取cookie值”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“php如何获取cookie值”吧!在php中,可以使用超全局变量“$_COOKIE”来获取浏览器的Co
2023-06-20

python如何获取网页数据

Python获取网页数据的常用方法有以下几种:1. 使用urllib库:urllib是Python内置的标准库,提供了一系列用于处理URL的函数和类。使用urllib库可以发送HTTP请求,获取网页数据。具体的步骤如下:```pythoni
2023-09-07

php如何获取网页内的视频

PHP可以通过以下几种方法获取网页内的视频:1. 使用DOM解析器:PHP提供了许多DOM解析器,例如DOMDocument和SimpleXMLElement,可以使用这些解析器来解析HTML文档,并提取其中的视频链接。```php$htm
2023-09-15

python如何获取网页指定内容

要获取网页中的指定内容,可以使用Python的requests库来发送HTTP请求,并使用BeautifulSoup库来解析HTML页面。以下是一个示例代码,用于获取网页中的标题:```pythonimport requestsfrom b
2023-08-11

如何用Python获取网页指定内容

这篇文章主要介绍“如何用Python获取网页指定内容”,在日常操作中,相信很多人在如何用Python获取网页指定内容问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何用Python获取网页指定内容”的疑惑有所
2023-06-29

jQuery如何获取页面宽度?

获取页面宽度jQuery提供多种方法获取页面宽度,包括:$(window).width():获取浏览器窗口视口的可见宽度(不含滚动条)。$(document).width():获取整个文档的总宽度(含隐藏部分)。$(window).innerWidth():获取浏览器窗口视口的内部宽度(含滚动条)。$(document).innerWidth():获取整个文档的内部宽度(含滚动条)。$(window).outerWidth():获取浏览器窗口包括边框和滚动条的外部宽度。$(document).outerW
jQuery如何获取页面宽度?
2024-04-08

jQuery如何获取页面高度?

获取页面高度jQuery提供了获取页面高度的多种方法:$(document).height():获取整个文档高度,包括可见和不可见区域。$(window).height():获取浏览器窗口当前高度,即用户可见的部分。$(element).height():获取指定元素的高度。window.innerHeight:返回浏览器窗口视口高度,包括滚动条。document.documentElement.scrollHeight:获取文档总高度,包括滚动条。选择合适的方法取决于您需要获取的高度类型。
jQuery如何获取页面高度?
2024-04-08

python怎么获取网页图片

可以使用Python的requests库来获取网页图片。具体步骤如下:1. 导入requests库:`import requests`2. 发送HTTP请求获取网页内容:`response = requests.get(url)`3. 检查
2023-08-17

php怎么获取网页内容

在PHP中,可以使用file_get_contents()函数来获取网页内容。可以通过传入网页的URL作为参数来获取该网页的内容。示例代码如下:$url = "http://example.com"; // 网页的URL$conten
php怎么获取网页内容
2024-02-29

python爬虫中如何获取cookie和添加代理池

要在Python爬虫中获取cookie和添加代理池,可以使用以下方法:获取Cookie:1. 使用requests库发送HTTP请求时,可以通过设置`cookies`参数来传递Cookie,例如:```pythonimport reques
2023-09-22

php如何获取本页面的id

在PHP中,可以使用$_SERVER['PHP_SELF']来获取当前页面的URL,然后使用parse_url函数解析URL,获取其path部分,再使用basename函数获取页面的文件名,最后使用pathinfo函数获取文件名中的id。以
2023-10-22

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录