获取b站的一个活动的声优声音的mp3文件（简单爬虫）

原創

RAVEN_1452

2020-06-07 06:32

以下程序可以直接运行。

涉及到的知识点：文件路径及创建，http请求，内容提取（正则表达式），文件写入硬盘。

还可以加入多线程，让程序跑的更快。

import  re,requests,os
list=['kiana','mei','bronya','theresa','seele','himeko'] #首先定义了需要获取的角色名字的列表。
dir='file4'#定义文件夹的名字，该文件夹会在你执行脚本的路径下生成
if not os.path.exists(os.getcwd()+os.path.sep+dir):
    os.mkdir(dir)
    print(os.getcwd()+os.path.sep+dir)
os.chdir(os.getcwd()+os.path.sep+dir)#判断是否存在重名的文件夹，重名了就直接拿来用了；不存在就创建一个文件夹，。
for name in list:#从列表中一个一个取出name
    for x in range(1,8):#x从1递增到7，为什么是7？其实无所谓，因为每个人的mp3只有5个，只要不小于5即可。
        url='http://static.biligame.net/teos2/gw/pc/cv/{}/japan/00{}.mp3'.format(name,x)#构建url
        print(url)
        filename=url.split('/')[-3]+url.split('/')[-1]
        r = requests.get(url)#这句是灵魂，调用requests库的get方法，访问构建url的资源，r得到的就是需要的mp3了
        if r.status_code==200:
            print('find {}{}'.format(name,x))#判断是否成功了
            with open(filename, 'wb') as f:#成功了的话，写入文件，wb=write binary，即以二进制写入文件。
                f.write(r.content)
                print(filename+'get daze!')
        else:
            print('not find resource ：'+filename)
print('your files in '+os.getcwd())#打印存储文件的路径
print('done')#提示程序结束

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

获取b站的一个活动的声优声音的mp3文件（简单爬虫）

钉钉打卡速度慢

Nginx R31 doc 官方文档-01-nginx 如何安装

Qt/C++音视频开发74-合并标签图形/生成yolo运算结果图形/文字和图形合并成一个/水印滤镜

挑战程序设计竞赛 2.2章习题 POJ - 3617 Best Cow Line 贪心

字节面试：MySQL什么时候锁表？如何防止锁表？

.NET8连接SQL SERVER 2008 R2 报：证书链是由不受信任的颁发机构颁发的

golang开发环境搭建(win10)

python计算机视觉学习笔记——PIL库的用法

Golang初学：获取程序内存使用情况，std runtime

bs4 '4.8.2'版本html解析錯誤（使用findall方法查找link標籤，返回中包含style標籤）

【python】斐波那契數列的3種計算方式及解析

import this 模塊分析及python思考（python之禪）

python eol error錯誤

win10系統 72s更新一次arp表中的mac地址

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結