位置：首页-资讯-后端开发

Python字体反爬实战案例分享

2024-04-02 19:55

短信预约 -IT技能 免费直播动态提醒

实战场景

本篇博客学习字体反爬，涉及的站点是实习 x，目标站点地址直接百度搜索即可。

可以看到右侧源码中出现了很多“乱码”，这其中就包含了关键信息。

接下来按照常规的套路，在开发者工具中检索字体相关信息，但是筛选之后，并没有得到反爬的字体，只有一个 file? 有些许的可能性。

这里就是一种新鲜的场景了，如果判断不准，那只能用字体样式和字体标签名进行判断了。
在网页源码中检索 @font-face 和 myFont，得到下图内容，这里发现 file 字体又出现了，看来解决问题的关键已经出现了。

下载文件名之后发现无后缀名，我们可以补上一个 .ttf 的后缀，接下来拖拽到 FontCreator 中，然后进行查阅。

二次刷新页面之后，再次获取一个 file 文件，查看二者是否有编码变化问题。

结论：每次请求字体文件，得到的响应无变化。

既然没有变化，后续的字体反爬实战编码就变的简单了。

实战编码

解析字体文件，获取编码与字符。

from fontTools.ttLib import TTFont
font1 = TTFont('./fonts/file.ttf')
keys,values = [],[]
for k, v in font1.getBestCmap().items():
    print(k,v)

得到的结果如下所示：

2 extra bytes in post.stringData array
120 x
57345 uni4E00
57360 uni77
57403 uni56
……

然后我们查看一下实习僧站点返回的数据。

&#xf626&#xf395&#xf395-&#xf043&#xf395&#xf395

这其中又涉及到了编码的转换。

我们拿到一段带编码的文字，如下所示：

&#xedb3&#xe4d0&#xe4d0&#xedb3&#xe12a&#xeb3d销售实习&#xe595

接下来查看一下页面呈现的文字

SaaS软件销售实习生

其中 &#xedb3 对应的是 S 字符，再看一下该字符在字体文件中的编码，如下所示。

但是从刚才的结果中，并未得到 edb3 相关值，但是把十进制的编码进行转换之后，得到下述结果。

到此这篇关于Python字体反爬实战案例分享的文章就介绍到这了,更多相关Python字体反爬内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

Python字体反爬实战案例分享

下载Word文档到电脑，方便收藏和打印～

下载Word文档

Python字体反爬实战案例分享

目录

实战场景

实战编码

Python字体反爬实战案例分享

相关文章

猜你喜欢

Python字体反爬实战案例分享

python起点网月票榜字体反爬案例

Python Ajax爬虫案例分享

python政策网字体反爬实例(附完整代码)

python超详细实现字体反爬流程

Python网络爬虫实战案例之：7000

Python爬取城市租房信息实战分享

Golang应用实践：实战经验与案例分享

Python开发之迭代器&生成器的实战案例分享

Golang动态库实战：案例分享与实用技巧

PHP Linux脚本编程指南：实战案例分享

Python异步爬取知乎热榜实例分享

python中如何实现反爬2021猫眼票房字体加密

PHP对象转字符的实用案例分享

PHP框架性能优化：实战指南与案例分享

PHP gPRC 案例分享：从实战中学习 gPRC 的应用

Vue生态的实践之道：实战案例与经验分享

大数据开发必备：Python IDE 中的调试技巧与实战案例分享。

Python时间序列分析--ARIMA模型实战案例

PHP 防抖技术的应用案例分享和实战经验总结

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复