Python批量爬取抖音/快手/B站視頻（附源碼和exe）

原創

一行数据

2020-06-07 08:54

去年行哥給大家介紹了一行Python代碼下載各大網站的視頻（公開視頻），使用的工具包是you-get，具體使用方法如下：

但是最近行哥需要進行批量下載抖音/快手等網站的視頻，如果手動輸入代碼下載不是很方便。所以行哥希望先把要下載的視頻地址統一放到一個txt文件裏，之後再通過這個txt文件進行批量下載

1.Python代碼詳解
2.exe直接使用版本

1.Python代碼詳解

首先這個項目通過Python爬蟲，返回一定格式的信息，並使用flask提供簡易api進行下載。可下載各平臺的視頻、音樂和封面圖片，只要有鏈接地址，它就能下載。具體可下載的平臺和素材：

上下滾動查看更多

核心代碼如下，先讀出txt文件裏的內容並提取出其中的所有網址，之後進行解析生成對應的視頻、音樂和圖片下載地址，最後將地址裏的內容進行下載，同時使用了多線程加快代碼的批量下載速度

    path = "./一行數據公衆號/爬取抖音/批量下載鏈接.txt"
    with open(path, 'r') as f:
        what = f.read()
    for i in "1":
        urls = parse_urls(what)
        if not urls:
            print("bye~")
            break
        print(f"""
╭━━━━━━━━━━━━━╮
│ 一共{len(urls)}個鏈接 │
╰━━━━━━━━━━━━━╯
        """)
        all_task = []
        for idx, url in enumerate(urls):
            print(f"正在解析第{idx+1}個鏈接【{url}】")
            data = get_data(url)
            if data:
                all_task.extend(data2tasks(data))
        queue = Queue(maxsize=100)
        for t in all_task:
            queue.put(t)
        ts = [Thread(target=dl, args=(queue, )) for _ in range(min(len(all_task), 6))]
        for t in ts:
            t.start()
        for t in ts:
            t.join()

運行結果如下：