Python批量爬取抖音/快手/B站视频（附源码和exe）

原創

一行数据

2020-06-07 08:54

去年行哥给大家介绍了一行Python代码下载各大网站的视频（公开视频），使用的工具包是you-get，具体使用方法如下：

但是最近行哥需要进行批量下载抖音/快手等网站的视频，如果手动输入代码下载不是很方便。所以行哥希望先把要下载的视频地址统一放到一个txt文件里，之后再通过这个txt文件进行批量下载

1.Python代码详解
2.exe直接使用版本

1.Python代码详解

首先这个项目通过Python爬虫，返回一定格式的信息，并使用flask提供简易api进行下载。可下载各平台的视频、音乐和封面图片，只要有链接地址，它就能下载。具体可下载的平台和素材：

上下滚动查看更多

核心代码如下，先读出txt文件里的内容并提取出其中的所有网址，之后进行解析生成对应的视频、音乐和图片下载地址，最后将地址里的内容进行下载，同时使用了多线程加快代码的批量下载速度

    path = "./一行数据公众号/爬取抖音/批量下载链接.txt"
    with open(path, 'r') as f:
        what = f.read()
    for i in "1":
        urls = parse_urls(what)
        if not urls:
            print("bye~")
            break
        print(f"""
╭━━━━━━━━━━━━━╮
│ 一共{len(urls)}个链接 │
╰━━━━━━━━━━━━━╯
        """)
        all_task = []
        for idx, url in enumerate(urls):
            print(f"正在解析第{idx+1}个链接【{url}】")
            data = get_data(url)
            if data:
                all_task.extend(data2tasks(data))
        queue = Queue(maxsize=100)
        for t in all_task:
            queue.put(t)
        ts = [Thread(target=dl, args=(queue, )) for _ in range(min(len(all_task), 6))]
        for t in ts:
            t.start()
        for t in ts:
            t.join()

运行结果如下：