Python爬蟲實戰,requests模塊,Python爬取網易雲歌曲並保存本地

前言

今天給大家簡單演示的爬取了一下某易雲歌曲的排行榜信息,最後將音樂保存到本地

開發工具

Python版本: 3.6.4

相關模塊:

requests模塊

re模塊

os模塊

環境搭建

安裝Python並添加到環境變量,pip安裝需要的相關模塊即可。

文末福利(python學習乾貨總結)的詳情在往期文章末尾:源碼及學生黨福利!評論區留言獲取

思路分析

本文以爬蟲某易雲音樂,講解如何採集某易雲音樂抓取歌曲

要爬取的部分歌曲如下圖所示:

提取我們歌曲頁面數據

瀏覽器中打開我們要爬取的頁面
按F12進入開發者工具,查看我們想要的數據在哪裏
這裏我們需要歌曲頁面數據就可以了

代碼實現:爬蟲蕞基本流程

1.發送請求
2.獲取數據
3.解析數據
4.保存數據

僞裝

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
url = 'https://music.163.com/discover/toplist?id=3778678'

1.發送請求

response = requests.get(url=url, headers=headers)

2.獲取數據

print(response.text)

3.解析數據

info_list = re.findall( 'lio<a href="/song \?id=(.*?)"">(.*?)</a></li>',html_data)
for music, title in result:
    music_url = f'http://music.163.com/song/media/outer/url?id={music}.mp3'
    music_content = requests.get(url=music_url, headers=headers).content

4.保存數據

    with open(filename + title + '.mp3', mode='wb') as f:
        f.write(music_content)
        print(title)

結果展示

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章