我的编程空间,编程开发者的网络收藏夹
学习永远不晚

使用pyppteer+ddddocr通过极验滑块验证码(附源码)

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

使用pyppteer+ddddocr通过极验滑块验证码(附源码)

前言:

        验证码是大多数爬虫都需要克服的难题。pyppteer是目前市场主流的自动化工具之一,它的优势在于不易被浏览器检测到,ddddocr也是目前主流的验证码识别的第三方模块。接下来就通过python自动化工具和ddddocr等第三方模块完成极验滑块。

一:使用自动化工具打开网站

        目标网站:行为验证4.0-适应型验证码-滑动验证,点选验证,图片验证-极验GeeTest

 

    # 浏览器 启动参数    start_parm = {        # 关闭无头浏览器        "headless": False,        "args": [            '--disable-infobars',  # 关闭自动化提示框            '--no-sandbox',  # 关闭沙盒模式            '--start-maximized',  # 窗口最大化模式        ],    }    browser = await launch(**start_parm)    page = await browser.newPage()    # 设置网页 视图大小    await page.setViewport(viewport={'width': 1920, 'height': 1080})    await page.goto('https://www.geetest.com/adaptive-captcha-demo')

二:控制鼠标定位到指定元素

   await page.waitForXPath('//div[@class="type-config"]')  # 等待元素加载    botton1 = await page.xpath('//div[@class="tab-item tab-item-1"]')  # 滑块拼图验证按钮    await botton1[0].click()    await page.click('#captcha', options={        'button': 'left',        'clickCount': 2,        'delay': 300,  # 延迟点击(ms)    })    botton2 = await page.xpath('//*[@aria-label="点击按钮开始验证"]')  # 开始验证按钮    await botton2[0].click()

三:提取滑块拼图照片url

elements_1 = await page.xpath(            '//*[@id="captcha"]/div[2]/div[1]/div[4]/div[1]/div[2]/div/div/div[1]/div[1]/div[1]/@style')  # 滑块图片链接        elements_2 = await page.xpath(            '//*[@id="captcha"]/div[2]/div[1]/div[4]/div[1]/div[2]/div/div/div[1]/div[2]/@style')  # 背景图片链接        for element in elements_1:            sc = await page.evaluate('(element) => element.textContent', element)            sc_url = sc.split('"')[1].split('"')[0]  # 提取滑块图片链接            with open('slice.png', 'wb')as f1:                f1.write(requests.get(sc_url).content)        for element in elements_2:            bg = await page.evaluate('(element) => element.textContent', element)            bg_url = bg.split('"')[1].split('"')[0]  # 提取背景图片链接            with open('bg.png', 'wb') as f2:                f2.write(requests.get(bg_url).content)

四:获取拼图坐标偏移量

async def get_xy():    det = ddddocr.DdddOcr(det=False, ocr=False)    with open('slice.png', 'rb') as f:        target_bytes = f.read()    with open('bg.png', 'rb') as f:        background_bytes = f.read()    try:        res = det.slide_match(target_bytes, background_bytes)        print(res)        return res.get('target')[0]    except:        return False

五:操作鼠标移动滑块

        其中x,y需要根据自己电脑进行微调。

        if target:            # print(target)            botton3 = await page.xpath(                '//*[@id="captcha"]/div[2]/div[1]/div[4]/div[1]/div[2]/div/div/div[2]/div/div[3]')            await botton3[0].hover()  # 鼠标悬停元素上            await page.mouse.down()  # 鼠标落下            await page.waitFor(500)            x = 1116 + target            y = 641            await page.mouse.move(x, y, {'steps': 2})  # 鼠标移动            await page.waitFor(500)            await page.mouse.up()  # 鼠标松开            time.sleep(2)            elements_3 = await page.xpath('//*[@id="captcha"]/div[2]/div[1]/div[3]/div[2]/div/div[2]/text()')            msg = ''            for element in elements_3:                msg = await page.evaluate('(element) => element.textContent', element)            if msg == '验证通过':                break            else:                print(msg)        else:  # 获取坐标失败时刷新验证            botton4 = await page.xpath('//*[@aria-label="刷新验证"]')            await botton4[0].click()

验证通过,欧耶~

六:完整代码

# coding:utf-8import ddddocr# coding:utf-8import asyncioimport timeimport requestsfrom pyppeteer.launcher import DEFAULT_ARGSDEFAULT_ARGS.remove("--enable-automation")from pyppeteer import launchasync def main():    # 浏览器 启动参数    start_parm = {        # 关闭无头浏览器        "headless": False,        "args": [            '--disable-infobars',  # 关闭自动化提示框            '--no-sandbox',  # 关闭沙盒模式            '--start-maximized',  # 窗口最大化模式        ],    }    browser = await launch(**start_parm)    page = await browser.newPage()    # 设置网页 视图大小    await page.setViewport(viewport={'width': 1920, 'height': 1080})    await page.goto('https://www.geetest.com/adaptive-captcha-demo')    time.sleep(2)    await page.waitForXPath('//div[@class="type-config"]')  # 等待元素加载    botton1 = await page.xpath('//div[@class="tab-item tab-item-1"]')  # 滑块拼图验证按钮    await botton1[0].click()    await page.click('#captcha', options={        'button': 'left',        'clickCount': 2,        'delay': 300,  # 延迟点击(ms)    })    botton2 = await page.xpath('//*[@aria-label="点击按钮开始验证"]')  # 开始验证按钮    await botton2[0].click()    while True:        time.sleep(5)        elements_1 = await page.xpath(            '//*[@id="captcha"]/div[2]/div[1]/div[4]/div[1]/div[2]/div/div/div[1]/div[1]/div[1]/@style')  # 滑块图片链接        elements_2 = await page.xpath(            '//*[@id="captcha"]/div[2]/div[1]/div[4]/div[1]/div[2]/div/div/div[1]/div[2]/@style')  # 背景图片链接        for element in elements_1:            sc = await page.evaluate('(element) => element.textContent', element)            sc_url = sc.split('"')[1].split('"')[0]  # 提取滑块图片链接            with open('slice.png', 'wb')as f1:                f1.write(requests.get(sc_url).content)        for element in elements_2:            bg = await page.evaluate('(element) => element.textContent', element)            bg_url = bg.split('"')[1].split('"')[0]  # 提取背景图片链接            with open('bg.png', 'wb') as f2:                f2.write(requests.get(bg_url).content)        target = await get_xy()  # 得到滑块x坐标偏移量        if target:            # print(target)            botton3 = await page.xpath(                '//*[@id="captcha"]/div[2]/div[1]/div[4]/div[1]/div[2]/div/div/div[2]/div/div[3]')            await botton3[0].hover()  # 鼠标悬停元素上            await page.mouse.down()  # 鼠标落下            await page.waitFor(500)            x = 1116 + target            y = 641            await page.mouse.move(x, y, {'steps': 2})  # 鼠标移动            await page.waitFor(500)            await page.mouse.up()  # 鼠标松开            time.sleep(2)            elements_3 = await page.xpath('//*[@id="captcha"]/div[2]/div[1]/div[3]/div[2]/div/div[2]/text()')            msg = ''            for element in elements_3:                msg = await page.evaluate('(element) => element.textContent', element)            if msg == '验证通过':                break            else:                print(msg)        else:  # 获取坐标失败时刷新验证            botton4 = await page.xpath('//*[@aria-label="刷新验证"]')            await botton4[0].click()    input('---验证通过---')    await browser.close()async def get_xy():    det = ddddocr.DdddOcr(det=False, ocr=False)    with open('slice.png', 'rb') as f:        target_bytes = f.read()    with open('bg.png', 'rb') as f:        background_bytes = f.read()    try:        res = det.slide_match(target_bytes, background_bytes)        print(res)        return res.get('target')[0]    except:        return Falseif __name__ == '__main__':    main()    asyncio.get_event_loop().run_until_complete(main())

 

来源地址:https://blog.csdn.net/weixin_61736939/article/details/130048614

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

使用pyppteer+ddddocr通过极验滑块验证码(附源码)

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Python中怎么使用ddddocr库识别图片与滑块验证码

这篇“Python中怎么使用ddddocr库识别图片与滑块验证码”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“Python中
2023-07-05

Python中识别图片/滑块验证码准确率极高的ddddocr库详解

验证码的种类有很多,它是常用的一种反爬手段,包括:图片验证码,滑块验证码,等一些常见的验证码场景。这里推荐一个简单实用的识别验证码的库 ddddocr (带带弟弟ocr)库,希望大家喜欢
2023-02-28

怎么使用selenium+opencv实现滑块验证码的登陆

本文小编为大家详细介绍“怎么使用selenium+opencv实现滑块验证码的登陆”,内容详细,步骤清晰,细节处理妥当,希望这篇“怎么使用selenium+opencv实现滑块验证码的登陆”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入
2023-07-06

怎么使用python识别滑块验证码中的缺口

这篇文章将为大家详细讲解有关怎么使用python识别滑块验证码中的缺口,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。验证码往往是爬虫路上的一只拦路虎,而其花样也是层出不穷:图片验证、滑块验证、交互式验证、
2023-06-14

使用python 怎么实现一个滑块验证码识别功能

今天就跟大家聊聊有关使用python 怎么实现一个滑块验证码识别功能,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。普通滑动验证import timefrom selenium imp
2023-06-14

利用Python+Selenium破解春秋航空网滑块验证码的实战过程

目录前言开发工具环境搭建实战记录一.验证码简介二.破解滑块验证码2.1计算滑块到缺口的距离2.2将滑块拖到缺口位置前言 记录一次利用Python+Selenium破解滑块验证码的实战过程。 让我们愉快地开始吧~开发工具 Python版本:
2022-06-02

Node.JS怎么使用纯JavaScript生成图片或滑块式验证码功能

本篇内容介绍了“Node.JS怎么使用纯JavaScript生成图片或滑块式验证码功能”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!有一些N
2023-06-17

python3 使用OpenCV计算滑块拼图验证码缺口位置(场景示例)

前言 滑块拼图验证码的失败难度在于每次图片上缺口位置不一样,需识别图片上拼图的缺口位置,使用python的OpenCV库来识别到 环境准备 pip 安装 opencv-pythonpip installl opencv-pythonOpen
2022-06-02

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录