Node.js 去掉种子(torrent)文件里的邪恶信息
2012 年,一部名为 ABS-130 的日本影片引起了网络的震动,网络上纷纷出现了 “当初求种像条狗,如今*完嫌人丑”的现象,成为了 2012 年互联网的一件大事件。
2014年,净网行动如火如荼地进行,各大互联网公司都作出了表率,一时之间XX云、X雷都把万恶的种子拒之门外。净网行动万岁!!(还我苍老师!!)
各大网盘、下载应用都从种子当中提取关键信息,将种子拒之门外。这些关键信息究竟藏在哪里?让我们一探究竟。
种子文件结构
以下内容来自维基百科
.torrent种子文件本质上是文本文件,包含Tracker信息和文件信息两部分。Tracker信息主要是BT下载中需要用到的Tracker服务器的地址和针对Tracker服务器的设置,文件信息是根据对目标文件的计算生成的,计算结果根据BitTorrent协议内的Bencode规则进行编码。它的主要原理是需要把提供下载的文件虚拟分成大小相等的块,块大小必须为2k的整数次方(由于是虚拟分块,硬盘上并不产生各个块文件),并把每个块的索引信息和Hash验证码写入种子文件中;所以,种子文件就是被下载文件的“索引”。
上图是一个典型种子的结构,那些被识别出来的邪恶关键字就藏在 name 和 file 当中。name 包含了该种子的名字,如:abcd-123 性感XXXX。而 file 当中的 path 则包含了要下载的所有文件的信息,如:草X社区最新地址.txt等等。
Node.js 和 parse-torrent 库
为了寻找出种子当中的邪恶信息我们请出了 Node.js 和 parse-torrent库 作为助手。
实验准备:
种子一枚安装 Node.js 电脑一台
首先我们利用 npm 安装 parse-torrent 库,它帮助我们快速找到种子内的信息。
npm install parse-torrent
var fs = require("fs");
var parseTorrent = require('parse-torrent');
var info = parseTorrent(fs.readFileSync('my.torrent'));
console.log(info);
这个库会将种子的信息解析出来,以对象的形式返回给我们。
查看结果:
name:
files:
可以看到用 parse-torrent 库解析出来的 name 和 files 的信息都是以 Buffer 形式存储。
清洗种子
如何将种子里的邪恶信息清洗掉,把万恶的种子扼杀在摇篮之中,最重要的就算要清除调 name 和 files 里面 path 的信息。
function cleanInfo (info) {
// 将种子名用 md5 加密
info.name = md5(info.name);
info['name.utf-8'] = md5(info['name.utf-8']);
var files = info.files;
for (var i = 0; i < files.length; i++) {
var file = files[i];
for (var key in file) {
if (key == "path" || key == "path.utf-8") {
for (var j = 0; j < file[key].length; j++) {
var text = file[key][j].toString();
var dotIndex = text.lastIndexOf(".");
// 将种子名用 md5 加密
file[key][j] = md5(text.slice(0,dotIndex)) + text.slice(dotIndex,text.length);
}
}
}
}
return info;
}
// 将清洗干净后的 info 对象重新生成一个 torrent 文件
var buf = parseTorrent.toTorrentFile({
info: cleanInfos[i]
});
fs.writeFile(dir + "/" + cleanInfos[i].name + ".torrent", buf);
经过这样之后,我们的邪恶种子文件就变成这样了:
实战阶段
首先准备一个种子,进行XX云的离线下载。
一开始它是被拒绝的。
然后运行脚本进行清洗。
node cleanTorrent IPTD-XXX.torrent
下载成功了!
脚本源码放在这里了,要去看一下我的下载内容了!!!
(**都脱了你给我看这个!!!)
最后
本文纯属技术讨论,感谢你的阅读,有不足之处请为我指出。
请您花一点时间将文章分享给您的朋友或者留下评论。我们将会由衷感谢您的支持!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341