网页Cookie如何获取

2023-06-26 14:35

短信预约 -IT技能 免费直播动态提醒

这篇文章主要讲解了“网页Cookie如何获取”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“网页Cookie如何获取”吧！

这里采用python2.7

第一种：mechanize

首先我们要使用mechanize，第一步:

pip install mechanize

第二步编写获取cookie代码：

import osimport mechanizeimport cookielib,rebr = mechanize.Browser()cj = cookielib.LWPCookieJar()br.set_cookiejar(cj)br.set_handle_equiv(True)br.set_handle_gzip(True)br.set_handle_redirect(True)br.set_handle_referer(True)br.set_handle_robots(False)br.set_handle_refresh(mechanize._http.HTTPRefreshProcessor(), max_time=1)br.set_debug_http(True)br.addheaders = [('User-agent', '用户ua')]br.set_proxies({"http": "代理"})response = br.open('https://www.amazon.com')cj = br._ua_handlers['_cookies'].cookiejarfor cookie in cj:    print("cookieName:"+cookie.name)    print("cookieValue:"+cookie.value)cookie = [item.name + ":" + item.value for item in cj]cookiestr={}for item in cookie:    name,value = item.split(":")    cookiestr[name]=value

运行结果：

网页Cookie如何获取

第二种：urllib

import urllib2import cookielibfrom http import cookiejarfrom bs4 import BeautifulSoupUser_Agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'header = {}header['User-Agent'] = User_Agentcookie = cookiejar.CookieJar()cookie_handle=urllib2.HTTPCookieProcessor(cookie)cookie_opener = urllib2.build_opener(cookie_handle)# proxy_support = urllib2.ProxyHandler({"http":"5.62.157.47:8085"})# proxy_opener = urllib2.build_opener(proxy_support)urllib2.install_opener(cookie_opener)# urllib2.install_opener(proxy_opener)request = urllib2.Request("https://www.amazon.com",headers=header)response = urllib2.urlopen(request)for item in cookie:    print('Name = ' +item.name)    print('Value =' +item.value)

运行结果：

网页Cookie如何获取

第三种：requests

import requestsheaders = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}r = requests.get('https://www.amazon.com', headers = headers)for cookie in r.cookies:    print(cookie.name)    print(cookie.value)    print("=========")

运行结果：

网页Cookie如何获取

第四种：selenium(个人感觉这个虽然加载比较慢，但是获取cookie最全)

pip install selenium

代码:

from selenium import webdriverdriver = webdriver.Chrome(executable_path='d:/seop/chromedriver.exe')driver.get("https://www.amazon.com")#for c in cookiestr.keys():#    driver.add_cookie({'name':c,'value':cookiestr[c]})#driver.get("https://www.amazon.com")cookie = [item["name"] + "=" + item["value"] for item in driver.get_cookies()]cookiestr = ';'.join(item for item in cookie)

运行结果:

网页Cookie如何获取

第五种:总觉得selenium比较慢，打开还要加载浏览器，于是尝试了 htmlunit以及phantomjs

htmlunit

网页Cookie如何获取

phantomjs

from selenium import webdriverbrowser = webdriver.PhantomJS()browser.get("https://www.amazon.com")cookie = [item["name"] + "=" + item["value"] for item in browser.get_cookies()]cookiestr = ';'.join(item for item in cookie)

运行结果：

网页Cookie如何获取

第六种：scrapy

这边我们简单测试一下，首先你电脑已经要安装了scrapy，如果没有安装，pip install scrapy

然后我们输入要获取地址的cookie

scrapy shell "https://www.amazon.com"

cookie结果：

网页Cookie如何获取

最后一种：chrome headless 使用无头浏览器来获取

这个目前我是在centos上面进行操作：

第一步：肯定你要安装chrome啦

第二步：运行安装脚本

curl https://intoli.com/install-google-chrome.sh | bash

测试是否成功：运行以下命令，如果成功会在当前目录下面保存百度的截图

google-chrome-stable --no-sandbox --headless --disable-gpu --screenshot     https://www.baidu.com

这里我们开始获取cookie信息

first：

google-chrome-stable --no-sandbox --headless --disable-gpu --user-data-dir="$HOME/Library/Application Support/Google/Chrome/" --remote-debugging-port=9222  https://www.amazon.com

second: 这里我们主要是获取websocket的url

curl -s localhost:9222/json

网页Cookie如何获取

third：这边要注意哦，要安装wsc，安装wsc之前记得要安装npm哦，然后在执行npm install -g wsc,然后在执行以下命令

wsc ws://localhost:9222/devtools/page/D42AFC3C9AF9C8A1511ADC60850BD5A8

然后输入：

{"id": 1, "method": "Network.getAllCookies"}

最后cookie结果：

网页Cookie如何获取

目前尝试了mechanize、urllib、selenium、headless chrome、requests、htmlunit、phantomjs、scrapy

目前已经尝试了以上八种，觉得还是selenium获取cookie比较全，信息比较完整，获取cookie的字段也是比较稳定的，经过研究cookie，就是selenium获取cookie的速度比较慢，看看还有没啥办法优化速度，继续查阅别的方式来获取cookie。

感谢各位的阅读，以上就是“网页Cookie如何获取”的内容了，经过本文的学习后，相信大家对网页Cookie如何获取这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是编程网，小编将为大家推送更多相关知识点的文章，欢迎关注！

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

网页Cookie如何获取

下载Word文档到电脑，方便收藏和打印～

下载Word文档

猜你喜欢

网页Cookie如何获取

这篇文章主要讲解了“网页Cookie如何获取”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“网页Cookie如何获取”吧！这里采用python2.7第一种：mechanize首先我们要使用me

2023-06-26

php如何获取cookie值

本篇内容主要讲解“php如何获取cookie值”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“php如何获取cookie值”吧!在php中，可以使用超全局变量“$_COOKIE”来获取浏览器的Co

2023-06-20

python如何获取网页数据

Python获取网页数据的常用方法有以下几种：1. 使用urllib库：urllib是Python内置的标准库，提供了一系列用于处理URL的函数和类。使用urllib库可以发送HTTP请求，获取网页数据。具体的步骤如下：```pythoni

2023-09-07

php如何获取网页内的视频

PHP可以通过以下几种方法获取网页内的视频：1. 使用DOM解析器：PHP提供了许多DOM解析器，例如DOMDocument和SimpleXMLElement，可以使用这些解析器来解析HTML文档，并提取其中的视频链接。```php$htm

2023-09-15

python如何获取网页指定内容

要获取网页中的指定内容，可以使用Python的requests库来发送HTTP请求，并使用BeautifulSoup库来解析HTML页面。以下是一个示例代码，用于获取网页中的标题：```pythonimport requestsfrom b

2023-08-11

如何用Python获取网页指定内容

这篇文章主要介绍“如何用Python获取网页指定内容”，在日常操作中，相信很多人在如何用Python获取网页指定内容问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”如何用Python获取网页指定内容”的疑惑有所

2023-06-29

获取页面宽度jQuery提供多种方法获取页面宽度，包括：$(window).width()：获取浏览器窗口视口的可见宽度（不含滚动条）。$(document).width()：获取整个文档的总宽度（含隐藏部分）。$(window).innerWidth()：获取浏览器窗口视口的内部宽度（含滚动条）。$(document).innerWidth()：获取整个文档的内部宽度（含滚动条）。$(window).outerWidth()：获取浏览器窗口包括边框和滚动条的外部宽度。$(document).outerW

2024-04-08

编程热搜

Python 学习之路 - Python
一、安装Python34Windows在Python官网（https://www.python.org/downloads/）下载安装包并安装。Python的默认安装路径是：C:\Python34配置环境变量：【右键计算机】--》【属性】-
chatgpt的中文全称是什么
chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，并协助人类完成一系列
C/C++中extern函数使用详解
C/C++可变参数的使用
可变参数的使用方法远远不止以下几种，不过在C,C++中使用可变参数时要小心，在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少，否则会产生访问越界，运气不好的话还会导致程序崩溃
css样式文件该放在哪里
php中数组下标必须是连续的吗
Python 3 教程
Python 3 教程 Python 的 3.0 版本，常被称为 Python 3000，或简称 Py3k。相对于 Python 的早期版本，这是一个较大的升级。为了不带入过多的累赘，Python 3.0 在设计的时候没有考虑向下兼容。 Python
Python pip包管理
一、前言在Python中，安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具： easy_install 和 pip ，目前官方推荐使用 pip。
ubuntu如何重新编译内核
改善Java代码之慎用java动态编译