Python批量爬取抖音/快手/B站視頻(附源碼和exe)

去年行哥給大家介紹了一行Python代碼下載各大網站的視頻(公開視頻),使用的工具包是you-get,具體使用方法如下:

但是最近行哥需要進行批量下載抖音/快手等網站的視頻,如果手動輸入代碼下載不是很方便。所以行哥希望先把要下載的視頻地址統一放到一個txt文件裏,之後再通過這個txt文件進行批量下載

  • 1.Python代碼詳解

  • 2.exe直接使用版本

1.Python代碼詳解

首先這個項目通過Python爬蟲,返回一定格式的信息,並使用flask提供簡易api進行下載。可下載各平臺的視頻、音樂和封面圖片,只要有鏈接地址,它就能下載。具體可下載的平臺和素材:

上下滾動查看更多

核心代碼如下,先讀出txt文件裏的內容並提取出其中的所有網址,之後進行解析生成對應的視頻、音樂和圖片下載地址,最後將地址裏的內容進行下載,同時使用了多線程加快代碼的批量下載速度

    path = "./一行數據公衆號/爬取抖音/批量下載鏈接.txt"
    with open(path, 'r') as f:
        what = f.read()
    for i in "1":
        urls = parse_urls(what)
        if not urls:
            print("bye~")
            break
        print(f"""
╭━━━━━━━━━━━━━╮
│ 一共{len(urls)}個鏈接 │
╰━━━━━━━━━━━━━╯
        """)
        all_task = []
        for idx, url in enumerate(urls):
            print(f"正在解析第{idx+1}個鏈接【{url}】")
            data = get_data(url)
            if data:
                all_task.extend(data2tasks(data))
        queue = Queue(maxsize=100)
        for t in all_task:
            queue.put(t)
        ts = [Thread(target=dl, args=(queue, )) for _ in range(min(len(all_task), 6))]
        for t in ts:
            t.start()
        for t in ts:
            t.join()

運行結果如下:

源碼地址是:https://github.com/XiyaoWong/spiders,本文行哥對這位大佬的代碼進行修改和封裝,大家需要的話可以下載下來學習

2.Exe直接使用版本

行哥爲了方便不會Python的讀者使用,將其封裝成了exe版本,只需要三個步驟就可以批量下載各大平臺視頻素材

  • 1.點擊【選擇鏈接txt文件】,選擇已保存很多鏈接的txt文件,例如

  • 2.點擊【選擇路徑】設置保存視頻素材的文件地址

  • 3.點擊【開始爬取】,下載進度會在命令窗口裏實時顯示

最終的exe下載結果如下,爬取下來的文件分別保存在videos(視頻)和audios(音頻)兩個文件夾內,其中的視頻皆爲無水印版本:

這個自動批量爬取視頻的exe後臺回覆【一行08】可以獲得

3.最後

現在在平臺裏按照某個id或分區的所有視頻整體爬取還在開發中,有了解的讀者可以來給行哥投稿哦,行哥撒幣

——— / 往期精選 / ————

【人臉檢測】50行Python代碼實現顏值檢測

   【Python遊戲】十款經典Python遊戲

【Python分析】貧窮的原因

【Python可視化】5000億資產的展示

後臺回覆「進羣」可以加入我們的社羣哦~

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章