我的编程空间,编程开发者的网络收藏夹
学习永远不晚

用selenium解决滑块验证码

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

用selenium解决滑块验证码

前言

因为种种原因没能实现愿景的目标,在这里记录一下中间结果,也算是一个收场吧。这篇博客主要是用selenium解决滑块验证码的个别案列。
思路:

  1. 用selenium打开浏览器指定网站
  2. 将残缺块图片和背景图片下载到本地
  3. 对比两张图片的相似地方,计算要滑动的距离
  4. 规划路线,移动滑块

实现步骤

1. 用selenium打开浏览器浏览指定网站

1.1 找到chromedriver.exe的路径

点击开始找到谷歌图标==》右键更多==》打开文件位置==》右键谷歌快捷方式==》属性 ==》打开文件所在的位置 ==》复制路径
chromedriver.exe路径

1.2 代码

from selenium import webdriver# chrome_path要改成你自己的路径chrome_path = r"C:\Users\11248\AppData\Local\Google\Chrome\Application\chromedriver.exe"url = 'https://icas.jnu.edu.cn/cas/login'driver = webdriver.Chrome(chrome_path)driver.get(url)

2.将残缺块图片和背景图片下载到本地

2.1 找到图片位置

打开网页进入开发者工具,找到图片位置
背景和滑块

2.2 代码

import timeimport requestsfrom PIL import Imagefrom selenium.webdriver.common.by import Byfrom io import BytesIOtime.sleep(5)# 进入页面要停留几秒钟,等页面加载完target_link = driver.find_element(By.CLASS_NAME, "yidun_bg-img").get_attribute('class="lazy" data-src')template_link = driver.find_element(By.CLASS_NAME, "yidun_jigsaw").get_attribute('class="lazy" data-src')target_img = Image.open(BytesIO(requests.get(target_link).content))template_img = Image.open(BytesIO(requests.get(template_link).content))target_img.save('target.jpg')template_img.save('template.png')

3. 对比两张图片的相似地方,计算要滑动的距离

3.1 用matchTemplate获取移动距离

因为背景图片中的残缺块位置和原始残缺图的亮度有所差异,直接对比两张图片相似的地方,往往得不到令人满意的结果,在此要对两张图片进行一定的处理,为了避免这种亮度的干扰,笔者这里将两张图片先进行灰度处理,再对图像进行高斯处理,最后进行边缘检测。

def handel_img(img):    imgGray = cv2.cvtColor(img, cv2.COLOR_RGBA2GRAY)  # 转灰度图    imgBlur = cv2.GaussianBlur(imgGray, (5, 5), 1)  # 高斯模糊    imgCanny = cv2.Canny(imgBlur, 60, 60)  # Canny算子边缘检测    return imgCanny

为增加工作量(放屁,统一代码好看点) 将JPG图像转变为4通道(RGBA)

def add_alpha_channel(img):    """ 为jpg图像添加alpha通道 """    r_channel, g_channel, b_channel = cv2.split(img)  # 剥离jpg图像通道    alpha_channel = np.ones(b_channel.shape, dtype=b_channel.dtype) * 255  # 创建Alpha通道    img_new = cv2.merge((r_channel, g_channel, b_channel, alpha_channel))  # 融合通道    return img_new

3.2 代码

import cv2# 读取图像def match(img_jpg_path, img_png_path):    # 读取图像    img_jpg = cv2.imread(img_jpg_path, cv2.IMREAD_UNCHANGED)    img_png = cv2.imread(img_png_path, cv2.IMREAD_UNCHANGED)    # 判断jpg图像是否已经为4通道    if img_jpg.shape[2] == 3:        img_jpg = add_alpha_channel(img_jpg)    img = handel_img(img_jpg)    small_img = handel_img(img_png)    res_TM_CCOEFF_NORMED = cv2.matchTemplate(img, small_img, 3)    value = cv2.minMaxLoc(res_TM_CCOEFF_NORMED)    value = value[3][0]  # 获取到移动距离    return value

3.3 检验效果

为了验证思路和方法是否得当,这里将滑块图片与背景图片进行拼接,为后面埋下一个小坑。

def merge_img(jpg_img, png_img, y1, y2, x1, x2):    """ 将png透明图像与jpg图像叠加        y1,y2,x1,x2为叠加位置坐标值    """    # 判断jpg图像是否已经为4通道    if jpg_img.shape[2] == 3:        jpg_img = add_alpha_channel(jpg_img)    # 获取要覆盖图像的alpha值,将像素值除以255,使值保持在0-1之间    alpha_png = png_img[yy1:yy2, xx1:xx2, 3] / 255.0    alpha_jpg = 1 - alpha_png    # 开始叠加    for c in range(0, 3):        jpg_img[y1:y2, x1:x2, c] = ((alpha_jpg * jpg_img[y1:y2, x1:x2, c]) + (alpha_png * png_img[yy1:yy2, xx1:xx2, c]))    return jpg_img    img_jpg_path = 'target.jpg'  # 读者可自行修改文件路径img_png_path = 'template.png'  # 读者可自行修改文件路径x1 = match(img_jpg_path, img_png_path)y1 = 0x2 = x1 + img_png.shape[1]y2 = y1 + img_png.shape[0]# 开始叠加res_img = merge_img(img_jpg, img_png, y1, y2, x1, x2)cv2.imshow("res_img ", res_img)cv2.waitKey(0)

4. 规划路线,移动滑块

4.1 点击滑块移动

用第3节已经获取到的距离,点击滑块进行移动

from selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.support.wait import WebDriverWaitfrom selenium.webdriver import ActionChainsdef crack_slider(distance):wait = WebDriverWait(driver, 20)    slider = wait.until(EC.element_to_be_clickable((By.CLASS_NAME, 'yidun_slider')))    ActionChains(self.driver).click_and_hold(slider).perform()    ActionChains(self.driver).move_by_offset(xoffset=distance, yoffset=0).perform()    time.sleep(2)    ActionChains(self.driver).release().perform()    return 0

神奇的事情是,坑来了,没有匹配成功。

4.2 匹配失败原因

这里有以下两点原因:

  1. 图片尺寸发生了变化,距离要进行转换。
  2. 滑块滑动时,滑块和残缺块的相对位置有变动。

首先解决图片尺寸变化问题,找到网页中图片大小:345x172.500
背景图片尺寸大小
下载到本地图片大小:480x240
本地背景尺寸大小
所以要对距离进行以下处理:

distance = distance / 480 * 345

关于第二个问题,这里没有找到很好的测量工具测量出来,好在验证码对位置精确度要求不高,就一个个试数吧。

distance = distance /480 * 345 + 12

5 运行演示

success

补充

在对极验验证码进行学习中,有的网站对移动轨迹进行了验证,如果滑动太快,也会被识别出机器操作,为了模拟人工操作,出色的程序员写出了一个魔幻移动轨迹,举个例子:我们可以先超过目标,再往回移动。

 def get_tracks(distance):     distance += 20     v = 0     t = 0.2     forward_tracks = []     current = 0     mid = distance * 3 / 5     while current < distance:         if current < mid:             a = 2         else:             a = -3         s = v * t + 0.5 * a * (t ** 2)         v = v + a * t         current += s         forward_tracks.append(round(s))     back_tracks = [-3, -3, -2, -2, -2, -2, -2, -1, -1, -1]     return {'forward_tracks': forward_tracks, 'back_tracks': back_tracks}  def crack_slider(tracks):    wait = WebDriverWait(driver, 20)      slider = wait.until(EC.element_to_be_clickable((By.CLASS_NAME, 'yidun_slider')))      ActionChains(driver).click_and_hold(slider).perform() # 模拟按住鼠标左键      for track in tracks['forward_tracks']:          ActionChains(driver).move_by_offset(xoffset=track, yoffset=0).perform()      time.sleep(0.5)      for back_tracks in tracks['back_tracks']:          ActionChains(driver).move_by_offset(xoffset=back_tracks, yoffset=0).perform()      ActionChains(driver).move_by_offset(xoffset=-4, yoffset=0).perform()      ActionChains(driver).move_by_offset(xoffset=4, yoffset=0).perform()      time.sleep(0.5)      ActionChains(driver).release().perform()# 释放左键      return 0

完整代码

# coding=utf-8import reimport requestsimport timefrom io import BytesIOimport cv2import numpy as npfrom PIL import Imagefrom selenium import webdriverfrom selenium.webdriver import ActionChainsfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support import expected_conditions as ECfrom selenium.webdriver.support.wait import WebDriverWaitclass CrackSlider():    # 通过浏览器截图,识别验证码中缺口位置,获取需要滑动距离,并破解滑动验证码    def __init__(self):        super(CrackSlider, self).__init__()        self.opts = webdriver.ChromeOptions()        self.opts.add_experimental_option('excludeSwitches', ['enable-logging'])        # self.driver = webdriver.Chrome(ChromeDriverManager().install(), options=self.opts)        chrome_path = r"C:\Users\11248\AppData\Local\Google\Chrome\Application\chromedriver.exe"        self.driver = webdriver.Chrome(chrome_path, options=self.opts)        self.url = 'https://icas.jnu.edu.cn/cas/login'        self.wait = WebDriverWait(self.driver, 10)    def get_pic(self):        self.driver.get(self.url)        time.sleep(5)        target_link = self.driver.find_element(By.CLASS_NAME, "yidun_bg-img").get_attribute('class="lazy" data-src')        template_link = self.driver.find_element(By.CLASS_NAME, "yidun_jigsaw").get_attribute('class="lazy" data-src')        target_img = Image.open(BytesIO(requests.get(target_link).content))        template_img = Image.open(BytesIO(requests.get(template_link).content))        target_img.save('target.jpg')        template_img.save('template.png')    def crack_slider(self, distance):        slider = self.wait.until(EC.element_to_be_clickable((By.CLASS_NAME, 'yidun_slider')))        ActionChains(self.driver).click_and_hold(slider).perform()        ActionChains(self.driver).move_by_offset(xoffset=distance, yoffset=0).perform()        time.sleep(2)        ActionChains(self.driver).release().perform()        return 0def add_alpha_channel(img):    """ 为jpg图像添加alpha通道 """    r_channel, g_channel, b_channel = cv2.split(img)  # 剥离jpg图像通道    alpha_channel = np.ones(b_channel.shape, dtype=b_channel.dtype) * 255  # 创建Alpha通道    img_new = cv2.merge((r_channel, g_channel, b_channel, alpha_channel))  # 融合通道    return img_newdef handel_img(img):    imgGray = cv2.cvtColor(img, cv2.COLOR_RGBA2GRAY)  # 转灰度图    imgBlur = cv2.GaussianBlur(imgGray, (5, 5), 1)  # 高斯模糊    imgCanny = cv2.Canny(imgBlur, 60, 60)  # Canny算子边缘检测    return imgCannydef match(img_jpg_path, img_png_path):    # 读取图像    img_jpg = cv2.imread(img_jpg_path, cv2.IMREAD_UNCHANGED)    img_png = cv2.imread(img_png_path, cv2.IMREAD_UNCHANGED)    # 判断jpg图像是否已经为4通道    if img_jpg.shape[2] == 3:        img_jpg = add_alpha_channel(img_jpg)    img = handel_img(img_jpg)    small_img = handel_img(img_png)    res_TM_CCOEFF_NORMED = cv2.matchTemplate(img, small_img, 3)    value = cv2.minMaxLoc(res_TM_CCOEFF_NORMED)    value = value[3][0]  # 获取到移动距离    return value    # 1. 打开chromedriver,试试下载图片cs = CrackSlider()cs.get_pic()# 2. 对比图片,计算距离img_jpg_path = 'target.jpg'  # 读者可自行修改文件路径img_png_path = 'template.png'  # 读者可自行修改文件路径distance = match(img_jpg_path, img_png_path)distance = distance /480 * 345 + 12# 3. 移动cs.crack_slider(distance)

来源地址:https://blog.csdn.net/qq_44419449/article/details/127414044

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

用selenium解决滑块验证码

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

用selenium解决滑块验证码的实现步骤

验证码作为一种自然人的机器人的判别工具,被广泛的用于各种防止程序做自动化的场景中,下面这篇文章主要给大家介绍了关于用selenium解决滑块验证码的实现步骤,需要的朋友可以参考下
2023-02-14

selenium+opencv实现滑块验证码的登陆

很多网站登录登陆时都要用到滑块验证码,本文主要介绍了selenium+opencv实现滑块验证码的登陆,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2023-05-15

怎么使用selenium+opencv实现滑块验证码的登陆

本文小编为大家详细介绍“怎么使用selenium+opencv实现滑块验证码的登陆”,内容详细,步骤清晰,细节处理妥当,希望这篇“怎么使用selenium+opencv实现滑块验证码的登陆”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入
2023-07-06

selenium+java破解极验滑动验证码的示例代码

摘要分析验证码素材图片混淆原理,并采用selenium模拟人拖动滑块过程,进而破解验证码。人工验证的过程1、打开威锋网注册页面2、移动鼠标至小滑块,一张完整的图片会出现(如下图1)3、点击鼠标左键,图片中间会出现一个缺块(如下图2)4、移动
2023-05-30

python滑块验证码如何破解

很抱歉,我不能提供关于破解滑块验证码的信息。这是不道德且违法行为,违反了网站的服务条款和法律法规。我鼓励尊重和遵守所有的在线服务和法律规定。如果你遇到滑块验证码问题,建议你尝试其他解决方案,例如通过验证身份、输入验证码等方式来完成验证。
2023-08-24

Java selenium处理极验滑动验证码示例

要爬取一个网站遇到了极验的验证码,这周都在想着怎么破解这个,网上搜了好多知乎上看到有人问了这问题,我按照这思路去大概实现了一下。1.使用htmlunit(这种方式我没成功,模拟鼠标拖拽后轨迹没生成,可以跳过)我用的是java,我首先先想到了
2023-05-31

利用Python+Selenium破解春秋航空网滑块验证码的实战过程

目录前言开发工具环境搭建实战记录一.验证码简介二.破解滑块验证码2.1计算滑块到缺口的距离2.2将滑块拖到缺口位置前言 记录一次利用Python+Selenium破解滑块验证码的实战过程。 让我们愉快地开始吧~开发工具 Python版本:
2022-06-02

怎么用JavaScript实现滑块验证码

本篇内容主要讲解“怎么用JavaScript实现滑块验证码”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么用JavaScript实现滑块验证码”吧!效果:鼠标在底部滑块上按下按住不松拖动可以移
2023-06-25

Python爬虫怎么破解滑块验证码

这篇文章主要介绍“Python爬虫怎么破解滑块验证码”,在日常操作中,相信很多人在Python爬虫怎么破解滑块验证码问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python爬虫怎么破解滑块验证码”的疑惑有所
2023-06-20

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录