前言
今天給大家簡單演示的爬取了一下某易雲歌曲的排行榜信息,最後將音樂保存到本地
開發工具
Python版本: 3.6.4
相關模塊:
requests模塊
re模塊
os模塊
環境搭建
安裝Python並添加到環境變量,pip安裝需要的相關模塊即可。
文末福利(python學習乾貨總結)的詳情在往期文章末尾:源碼及學生黨福利!評論區留言獲取
思路分析
本文以爬蟲某易雲音樂,講解如何採集某易雲音樂抓取歌曲
要爬取的部分歌曲如下圖所示:
提取我們歌曲頁面數據
瀏覽器中打開我們要爬取的頁面
按F12進入開發者工具,查看我們想要的數據在哪裏
這裏我們需要歌曲頁面數據就可以了
代碼實現:爬蟲蕞基本流程
1.發送請求
2.獲取數據
3.解析數據
4.保存數據
僞裝
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
url = 'https://music.163.com/discover/toplist?id=3778678'
1.發送請求
response = requests.get(url=url, headers=headers)
2.獲取數據
print(response.text)
3.解析數據
info_list = re.findall( 'lio<a href="/song \?id=(.*?)"">(.*?)</a></li>',html_data)
for music, title in result:
music_url = f'http://music.163.com/song/media/outer/url?id={music}.mp3'
music_content = requests.get(url=music_url, headers=headers).content
4.保存數據
with open(filename + title + '.mp3', mode='wb') as f:
f.write(music_content)
print(title)