Python爬虫实战-批量爬取下载网易云音乐

大家好,我是python222小锋老师。前段时间卷了一套 Python3零基础7天入门实战icon-default.png?t=N7T8https://blog.csdn.net/caoli201314/article/details/132882813
1小时掌握Python操作Mysql数据库之pymysql模块技术icon-default.png?t=N7T8https://blog.csdn.net/caoli201314/article/details/133199207
一天掌握python爬虫【基础篇】 涵盖 requests、beautifulsoup、seleniumicon-default.png?t=N7T8https://blog.csdn.net/caoli201314/article/details/134071440

近日锋哥又卷了一波Python实战课程-批量爬取下载网易云音乐,主要是巩固下Python爬虫基础

视频版教程:Python爬虫实战-批量爬取下载网易云音乐icon-default.png?t=N7T8https://www.bilibili.com/video/BV1aw411M72B/

网易云音乐官方主页:

https://music.163.com/

比如我们打开邓紫棋的主页:

https://music.163.com/#/artist?id=7763

现在我们要爬取这里面的音乐文件,我们正常人的分析思路是这样的。

    思路:
    1,根据歌手链接地址获取页面源码
    2,解析页面源码获取所有歌曲列表
    3,遍历,下载每首歌曲

前面两步很简单,很容易实现。

第三步,我们点 音乐列表 前面的播放按钮,当前页面底部会出现播放器,播放音乐。

谷歌 F12 进入开发者工具,点 Media 我们是可以得到音乐的源文件的。包括VIP音乐

我们要通过Python得到这个请求地址,需要进行js逆向,破解,得到js方法源代码,然后进行模拟拼接动态请求,得到音乐二进制文件,锋哥上有老,下有小,容易受到律师函,进去踩缝纫车,就不搞这种方式。

我们还是采用网易云官方提供的API接口进行获取音乐文件,包括在线播放。

网易云音乐开放接口:http://music.163.com/song/media/outer/url?id=歌曲ID  (VIP音乐下载不了)

完整可运行代码如下。具体代码分析,可以看帖子开头的视频教程

python">"""
    思路:
    1,根据歌手链接地址获取页面源码
    2,解析页面源码获取所有歌曲列表
    3,遍历,下载每首歌曲
    python爬虫前置基础视频教程:http://python222.com/post/7
    备注:网易云音乐开放接口:http://music.163.com/song/media/outer/url?id=歌曲ID  (VIP音乐下载不了)
    测试:https://music.163.com/#/artist?id=7763
    仅供学习测试
"""

import requests
from bs4 import BeautifulSoup

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36'
}

# 获取用户输入的歌手链接页面
singer_url = input("请输入您要下载的歌手页面链接:")
# 格式化下载链接
url = singer_url.replace("/#", '')
response = requests.get(url=url, headers=headers)
# print(response.text)

# 实例化bs4
soup = BeautifulSoup(response.text, 'lxml')

# 获取歌曲列表
song_list = soup.select("ul.f-hide li a")
print(song_list)


def download_song(song_name, song_id):
    """
    下载歌曲
    :param song_name: 歌曲名称
    :param song_id: 歌曲ID
    :return:
    """
    music_open_api = "http://music.163.com/song/media/outer/url?id=" + song_id
    music = requests.get(url=music_open_api, headers=headers)
    # 下载歌曲
    try:
        with open(f"./music/{song_name}.mp3", 'wb') as file:
            file.write(music.content)
            print(f"《{song_name}》下载成功")
    except:
        print(song_name, "下载异常")


for song in song_list:
    # 获取歌曲名称
    song_name = song.text
    # print(song_name)
    # 获取歌曲ID
    song_id = song['href'].split("=")[1]
    # 下载歌曲
    download_song(song_name, song_id)


http://www.niftyadmin.cn/n/5149904.html

相关文章

网安新旅程

网安新旅程 将近四个月没发博客了,今天交代一下最近发生的事情和规划。 TryHackMyOffsecBox QQ交流 君羊:751273347 近期的事情 6月开始我进入htb学院学习CPTS,7月左右我完成了95%左右的内容。7-8月份我基本都在做C#相关的开发&#xff0c…

黔院长 | 贵州四部门联合发文加强新时代中医药人才工作!

近日,贵州省中医药管理局、省教育厅、省人力资源社会保障厅和省卫生健康委联合印发《关于加强新时代中医药人才工作的实施意见》,《意见》强调培训”能中会西“的基层医生! 《意见》提出,要加强中医药高层次人才队伍建设&#xff…

c++11的emplace_back

emplace_back能就地地通过参数构造对象,不需要拷贝或者移动内存,相比push_back能更好的避免内存的拷贝与移动,使容器插入元素的性能得到进一步提升。在大多数情况下应该优先使用emplace_back来代替push_back。所有的标准库容器(ar…

QT namespace UI / PIMPL (Private Implementation / Pointer to Implementation)

简述: Qt编程中,会见到类似于如下的声明: 1 namespace Ui 2 { 3 class Dialog; 4 } 那么,为何要这样声明,这样声明有什么好处。 这是Designer使用了pimpl手法,pImpl手法主要作用是解开类的使用接口和实现的…

利用maven的dependency插件将项目依赖从maven仓库中拷贝到一个指定的位置

https://maven.apache.org/plugins/maven-dependency-plugin/copy-dependencies-mojo.html 利用dependency:copy-dependencies可以将项目的依赖从maven仓库中拷贝到一个指定的位置。 使用默认配置拷贝依赖 如果直接执行mvn dependency:copy-dependencies,是将项目…

如何进行大型项目的模块化设计和组织?

在C语言编程中,进行大型项目的模块化设计和组织是非常关键的,因为它有助于代码的可维护性、可扩展性和团队协作。在本文中,我将详细解释如何进行大型项目的模块化设计和组织,包括以下主题: 1. 什么是模块化设计&#…

决策树算法的实现

决策树是一种机器学习算法,它类似于人脑思考问题的过程。我们可以通过问一系列的问题来逐步缩小答案的范围,最终得到最终的答案。 比如说,我们想要预测一个人是否会购买某个产品,我们可以通过一系列的问题来缩小预测范围。例如&a…

Jmeter分布式压测 —— 易踩坑点

1、压测机 无论是从成本角度还是维护的难易方面,压测机的数量,适量就好。举个例子,8C16G的一台服务器,部署Jmeter后,根据我个人的测试比对数据,配置≤1500个线程数,最好。太多了性能损耗较大&a…