我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python字体反爬实战案例分享

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python字体反爬实战案例分享

实战场景 

本篇博客学习字体反爬,涉及的站点是实习 x,目标站点地址直接百度搜索即可。

可以看到右侧源码中出现了很多“乱码”,这其中就包含了关键信息。

接下来按照常规的套路,在开发者工具中检索字体相关信息,但是筛选之后,并没有得到反爬的字体,只有一个 file? 有些许的可能性。

这里就是一种新鲜的场景了,如果判断不准,那只能用字体样式和字体标签名进行判断了。
在网页源码中检索 @font-face 和 myFont,得到下图内容,这里发现 file 字体又出现了,看来解决问题的关键已经出现了。

下载文件名之后发现无后缀名,我们可以补上一个 .ttf 的后缀,接下来拖拽到 FontCreator 中,然后进行查阅。

二次刷新页面之后,再次获取一个 file 文件,查看二者是否有编码变化问题。

结论:每次请求字体文件,得到的响应无变化。

既然没有变化,后续的字体反爬实战编码就变的简单了。

实战编码 

解析字体文件,获取编码与字符。

from fontTools.ttLib import TTFont
font1 = TTFont('./fonts/file.ttf')
keys,values = [],[]
for k, v in font1.getBestCmap().items():
    print(k,v)

得到的结果如下所示:

2 extra bytes in post.stringData array
120 x
57345 uni4E00
57360 uni77
57403 uni56
……

然后我们查看一下实习僧站点返回的数据。

&#xf626&#xf395&#xf395-&#xf043&#xf395&#xf395

这其中又涉及到了编码的转换。

我们拿到一段带编码的文字,如下所示:

&#xedb3&#xe4d0&#xe4d0&#xedb3&#xe12a&#xeb3d销售实习&#xe595

接下来查看一下页面呈现的文字

SaaS软件销售实习生

其中 &#xedb3 对应的是 S 字符,再看一下该字符在字体文件中的编码,如下所示。

但是从刚才的结果中,并未得到 edb3 相关值,但是把十进制的编码进行转换之后,得到下述结果。

到此这篇关于Python字体反爬实战案例分享的文章就介绍到这了,更多相关Python字体反爬 内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Python字体反爬实战案例分享

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Python网络爬虫实战案例之:7000

一、前言本文是《Python开发实战案例之网络爬虫》的第三部分:7000本电子书下载网络爬虫开发实战详解。配套视频课程详见51CTO学院请添加链接描述。二、章节目录3.1 业务流程3.2 页面结构分析:目录页3.3 页面结构分析:详情页3.
2023-01-31

Golang应用实践:实战经验与案例分享

Golang应用实践:实战经验与案例分享近年来,作为一门快速发展且备受关注的编程语言,Golang在各个领域的应用越来越广泛。其简洁高效的设计让开发者能够快速地构建稳健的应用程序,同时其并发特性和内置的工具也为解决现代软件开发中的各种挑战
Golang应用实践:实战经验与案例分享
2024-03-05

Python开发之迭代器&生成器的实战案例分享

在Python中,迭代器和生成器都是用来遍历数据集合的工具,可以按需逐个生成或返回数据,从而避免一次性加载整个数据集合所带来的性能问题和内存消耗问题。本文主要和大家分享几个贴近实际运维开发工作中的场景案例,希望对大家有所帮助
2023-05-16

Golang动态库实战:案例分享与实用技巧

Golang动态库实战:案例分享与实用技巧在Golang(Go语言)中,使用动态库可以实现模块化开发、代码重用以及动态加载等功能。本文将通过案例分享和实用技巧,介绍如何在Golang中使用动态库,以及如何利用动态库提升代码的灵活性和可维护
Golang动态库实战:案例分享与实用技巧
2024-03-01

PHP Linux脚本编程指南:实战案例分享

【引言】在如今互联网飞速发展的时代,服务器端的脚本编程无疑扮演着至关重要的角色。而PHP作为一种开源的脚本语言,拥有广泛的应用范围和强大的自由性。本文将为您介绍如何在Linux环境中使用PHP进行脚本编程,并通过具体的实战案例分享,帮助您快
2023-10-21

python中如何实现反爬2021猫眼票房字体加密

这篇文章主要介绍python中如何实现反爬2021猫眼票房字体加密,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!python主要应用领域有哪些1、云计算,典型应用OpenStack。2、WEB前端开发,众多大型网站均
2023-06-14

PHP对象转字符的实用案例分享

PHP是一种广泛应用于Web开发的脚本语言,其面向对象的特性使得开发者可以更加高效地编写和管理代码。在实际开发中,经常会遇到需要将PHP对象转换为字符串的情况,本文将分享一些实用的案例并提供具体的代码示例。首先,我们来看一个简单的示例,在
PHP对象转字符的实用案例分享
2024-03-06

PHP框架性能优化:实战指南与案例分享

在 php 应用程序中,选择合适的框架对于性能至关重要。laravel 擅长易用性和功能性,但封装性可能影响性能。而 symfony 提供了自定义和性能精细控制,但组件管理的开销可能会降低性能。针对性优化技术包括:laravel 的预加载、
PHP框架性能优化:实战指南与案例分享
2024-05-24

PHP gPRC 案例分享:从实战中学习 gPRC 的应用

本文将分享基于PHP的gPRC实战案例,通过真实场景的示例,深入浅出地解析gPRC的应用,助力开发者快速掌握gRPC的开发技巧。
PHP gPRC 案例分享:从实战中学习 gPRC 的应用
2024-02-19

PHP 防抖技术的应用案例分享和实战经验总结

引言:在我们的日常开发工作中,经常会遇到一些需要响应用户事件的场景,如搜索框的自动补全、监听窗口滚动事件、监听输入框的实时输入等。但是,一些特殊场景下,用户事件的频繁触发会造成多次重复的请求,这对服务器造成不小的压力。为了解决这个问题,我们
2023-10-21

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录