1 安裝scrapy
最簡單的,萬無一失的方法, 打開Anaconda的Navigator, 選擇”ALL”, 然後搜索”scrapy”, 選中前面的對號, 右下角會有個”apply”,就是下載安裝了.幾分鐘搞定
- 2 代碼部分
import requests,os,time,sys,re
from scrapy.selector import Selector
from urllib import request
from tqdm import tqdm
class wangyiyun():
def __init__(self):
self.headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36',
'Referer': 'http://music.163.com/'}
self.main_url='http://music.163.com/'
self.session = requests.Session()
self.session.headers=self.headers
def get_songurls(self,playlist):
'''進入所選歌單頁面,得出歌單裏每首歌各自的ID 形式就是“song?id=64006"'''
url=self.main_url+'playlist?id=%d'% playlist
re= self.session.get(url) #直接用session進入網頁,懶得構造了
sel=Selector(text=re.text) #用scrapy的Selector,懶得用BS4了
songurls=sel.xpath('//ul[@class="f-hide"]/li/a/@href').extract()
print(songurls)
return songurls #所有歌曲組成的list
##['/song?id=64006', '/song?id=63959', '/song?id=25642714', '/song?id=63914', '/song?id=4878122', '/song?id=63650']
def get_songinfo(self,songurl):
'''根據songid進入每首歌信息的網址,得到歌曲的信息
return:'64006','陳小春-失戀王'''
url=self.main_url+songurl
re=self.session.get(url)
sel=Selector(text=re.text)
song_id = url.split('=')[1]
song_name = sel.xpath("//em[@class='f-ff2']/text()").extract_first()
singer= '&'.join(sel.xpath("//p[@class='des s-fc4']/span/a/text()").extract())
songname=singer+'-'+song_name
return str(song_id),songname
def download_song(self, songurl, dir_path):
'''根據歌曲url,下載mp3文件'''
song_id, songname = self.get_songinfo(songurl) # 根據歌曲url得出ID、歌名
song_url = 'http://music.163.com/song/media/outer/url?id=%s.mp3'%song_id
path = dir_path + os.sep + songname + '.mp3' # 文件路徑
# requests.urlretrieve(song_url, path) # 下載文件
request.urlretrieve(song_url, path) # 下載文件
def work(self, playlist):
songurls = self.get_songurls(playlist) # 輸入歌單編號,得到歌單所有歌曲的url
dir_path = r'F:/pachong_cloud' # 你需要下載歌曲的文件夾
for songurl in tqdm(songurls):
self.download_song(songurl, dir_path) # 下載歌曲
if __name__ == '__main__':
d = wangyiyun()
d.work(8888888888) # 你自己的需要下載的歌單號
需要注意兩點1. d.work()內寫的是歌單的序號, 按如下步驟做, 粘貼到任何可以粘貼的地方, 裏面會有個playlistid ,就是那個.
第2點,就是dir_path, 這裏寫你需要下載的文件夾,自己先創建好.
改完這兩處,直接運行就好了.