我的编程空间,编程开发者的网络收藏夹
学习永远不晚

如何用Python一次性下载抖音上音乐

短信预约 信息系统项目管理师 报名、考试、查分时间动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

如何用Python一次性下载抖音上音乐

目录
  • Python 链接抖音
  • 爬虫实现分析
    • 热歌榜内容
    • 网页解析
    • 巧用eval
  • 代码实现

    Python 链接抖音

    python下载抖音内容的帖子网上有一些,但都比较麻烦,需要通过adb连接安卓手机后,模拟操作。我这么懒,这种事儿玩不来…那么,该如何获取抖音内容呢?网上搜了下大概有两种方式,一个是浏览器插件快抖,另外一个是我今天要说的抖音网页版。其实这两者差别不是很大,都是先将抖音内容下载至服务器后,通过开发简单网站配置域名后,让大家访问。让我们来看看抖音网页版:

    爬虫实现分析

    热歌榜内容

    大家先开看看这个抖音热歌榜歌曲,每页20首歌曲,一个55页。但细不细心大家都能发现,很多歌曲存在重复的问题。所以,等下爬虫的时候,我们需要先准备一个music_list,用来识别这首歌曲是否已经下载过了…

    网页解析

    网页比较简单,一个div中包裹了一个ul>li*20,我们是不是该这样获取:

    
    soup.find('div',{"class":"pull-left"}).find('ul').findAll('a')

    如果你说是,那么一定没有好好看我前天整理的文章通过哪吒豆瓣影评,带你分析python爬虫快速入门:https://www.jianshu.com/p/ae38f7607902,我在文章中专门提到了一个小技巧,通过使用attr的属性进行快速解析,那么最快速的获取方式是:

    
    soup.findAll('a', attrs={'onclick': True})

    我们只需要获取所有的a标签,切这些标签中包含onclick这个属性即可。

    巧用eval

    我们解析到的内容通过attr[‘onclick'],可以得到他的属性open1(‘夜','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d),如何能快速获取歌曲名字和url呢?这里我们需要用到一个eval的小技巧:

    
    index = "open1('夜','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')"
    index[5:]
    "('夜','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')"
    index_tuple = eval(index[5:])
    print(index_tuple, type(index_tuple))
    ('夜', 'http://p9-dy.byteimg.com/obj/61a20007a98954b0831d', '') <class 'tuple'>
    index_tuple[0]
    '夜'
    index_tuple[1]
    'http://p9-dy.byteimg.com/obj/61a20007a98954b0831d'

    ps:今天一个朋友说我写代码没注释,我这是现身说法的告诉你,如何能写出让别人压根看不懂的代码,就是不写注释啊,哈哈!其实,代码我都在文章中一点一点的讲解了,所以没有写,但秉承着害怕大佬们取关的心态,我还是把注释加上吧…

    代码实现

    总体来说实现比较简单,全部代码如下:

    
    import os
    import requests
    from bs4 import BeautifulSoup
    import threading
    import time
    
    
    class DouYinMusic:
        def __init__(self):
            self.music_list = []
            self.path = self.download_path()
    
        @staticmethod
        def download_path():
            """
            获取代码执行目录,并在目录下创建Music文件夹
            :return Music文件夹全路径
            """
            base_dir = os.path.dirname(os.path.abspath(__file__))
            _path = os.path.join(base_dir, "Music")
            if not os.path.exists(_path):
                os.mkdir(_path)
            return _path
    
        def get_request(self, url):
            """
            封装requests.get方法
            如果为网页请求,返回网页内容
            否则,解析音乐地址,并返回音乐二进制文件
            :param url: 请求url(分网页、音乐两类)
            :return: 网页内容 & 音乐二进制文件
            """
            r = requests.get(url, timeout=5)
            if url.endswith('html'):
                return r.text
            else:
                return r.content
    
        def analysis_html(self, html):
            """
            根据获取的网页内容,解析音乐名称、下载地址
            调用音乐下载方法
            :param html: 网页内容
            """
            soup = BeautifulSoup(html, 'lxml')
            # 根据关键字onclick查找每个下载地址
            for tag_a in soup.findAll('a', attrs={'onclick': True}):
                # 下载格式'("name","link","")',通过eval将str转化为tuple类型
                link_list = eval(tag_a['onclick'][5:])
                music_name, music_link = link_list[:2]
                # 因为存在部分重复音乐,故设置判断下载过的音乐跳过
                if music_name in self.music_list:
                    continue
                self.music_list.append(music_name)
                t = threading.Thread(target=self.download_music, args=(music_name, music_link))
                time.sleep(0.5)
                t.start()
    
        def download_music(self, music_name, music_link):
            """
            解析音乐文件,完成音乐下载
            :param music_name: 音乐名称
            :param music_link: 下载地址
            """
            _full_name = os.path.join(self.path, music_name)
            with open(_full_name + '.mp3', 'wb') as f:
                f.write(self.get_request(music_link))
            print("抖音音乐:{} 下载完成".format(music_name))
    
        def run(self):
            """
            主方法,用于批量生成url
            """
            for page in range(1,55):
                url = "http://douyin.bm8.com.cn/t_{}.html".format(page)
                html = self.get_request(url)
                self.analysis_html(html)
    
    
    if __name__ == '__main__':
        main = DouYinMusic()
        main.run()

    来让我们看看效果吧:

    网站是通过nginx负载均衡搭建的,有一些链接已经失效了。最终下载了不重复的592首抖音音乐。

    同样的,大家喜欢可以按照这种方法,尝试下载一下网站的抖音视频。

    以上就是如何用Python一次性下载抖音上音乐的详细内容,更多关于Python一次性下载抖音上音乐的资料请关注编程网其它相关文章!

    免责声明:

    ① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

    ② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

    如何用Python一次性下载抖音上音乐

    下载Word文档到电脑,方便收藏和打印~

    下载Word文档

    猜你喜欢

    如何用Python一次性下载抖音上音乐

    目录Python 链接抖音爬虫实现分析热歌榜内容网页解析巧用eval代码实现Python 链接抖音 python下载抖音内容的帖子网上有一些,但都比较麻烦,需要通过adb连接安卓手机后,模拟操作。我这么懒,这种事儿玩不来…那么,该如何获取抖
    2022-06-02

    如何使用Python下载抖音无水印视频

    这篇文章主要介绍如何使用Python下载抖音无水印视频,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!一、获取抖音视频连接得到如下信息: “5.1 HV:/ 守门员戴手套没法系鞋带这种体育精神,值得尊敬%遇见足球 %足
    2023-06-15

    如何利用MySQL和Python开发一个简单的在线音乐平台

    如何利用MySQL和Python开发一个简单的在线音乐平台随着互联网的快速发展,音乐平台成为了许多人娱乐生活中不可或缺的一部分。本文将介绍如何使用MySQL和Python开发一个简单的在线音乐平台。一、准备工作首先,我们需要在电脑上安装My
    2023-10-22

    编程热搜

    • Python 学习之路 - Python
      一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
      Python 学习之路 - Python
    • chatgpt的中文全称是什么
      chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
      chatgpt的中文全称是什么
    • C/C++中extern函数使用详解
    • C/C++可变参数的使用
      可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
      C/C++可变参数的使用
    • css样式文件该放在哪里
    • php中数组下标必须是连续的吗
    • Python 3 教程
      Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
      Python 3 教程
    • Python pip包管理
      一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
      Python pip包管理
    • ubuntu如何重新编译内核
    • 改善Java代码之慎用java动态编译

    目录