去年行哥給大家介紹了一行Python代碼下載各大網站的視頻(公開視頻),使用的工具包是you-get,具體使用方法如下:
但是最近行哥需要進行批量下載抖音/快手等網站的視頻,如果手動輸入代碼下載不是很方便。所以行哥希望先把要下載的視頻地址統一放到一個txt文件裏,之後再通過這個txt文件進行批量下載
1.Python代碼詳解
2.exe直接使用版本
1.Python代碼詳解
首先這個項目通過Python爬蟲,返回一定格式的信息,並使用flask提供簡易api進行下載。可下載各平臺的視頻、音樂和封面圖片,只要有鏈接地址,它就能下載。具體可下載的平臺和素材:
上下滾動查看更多
核心代碼如下,先讀出txt文件裏的內容並提取出其中的所有網址,之後進行解析生成對應的視頻、音樂和圖片下載地址,最後將地址裏的內容進行下載,同時使用了多線程加快代碼的批量下載速度
path = "./一行數據公衆號/爬取抖音/批量下載鏈接.txt"
with open(path, 'r') as f:
what = f.read()
for i in "1":
urls = parse_urls(what)
if not urls:
print("bye~")
break
print(f"""
╭━━━━━━━━━━━━━╮
│ 一共{len(urls)}個鏈接 │
╰━━━━━━━━━━━━━╯
""")
all_task = []
for idx, url in enumerate(urls):
print(f"正在解析第{idx+1}個鏈接【{url}】")
data = get_data(url)
if data:
all_task.extend(data2tasks(data))
queue = Queue(maxsize=100)
for t in all_task:
queue.put(t)
ts = [Thread(target=dl, args=(queue, )) for _ in range(min(len(all_task), 6))]
for t in ts:
t.start()
for t in ts:
t.join()
運行結果如下:
源碼地址是:https://github.com/XiyaoWong/spiders,本文行哥對這位大佬的代碼進行修改和封裝,大家需要的話可以下載下來學習
2.Exe直接使用版本
行哥爲了方便不會Python的讀者使用,將其封裝成了exe版本,只需要三個步驟就可以批量下載各大平臺視頻素材
1.點擊【選擇鏈接txt文件】,選擇已保存很多鏈接的txt文件,例如
2.點擊【選擇路徑】設置保存視頻素材的文件地址
3.點擊【開始爬取】,下載進度會在命令窗口裏實時顯示
最終的exe下載結果如下,爬取下來的文件分別保存在videos(視頻)和audios(音頻)兩個文件夾內,其中的視頻皆爲無水印版本:
這個自動批量爬取視頻的exe後臺回覆【一行08】可以獲得
3.最後
現在在平臺裏按照某個id或分區的所有視頻整體爬取還在開發中,有了解的讀者可以來給行哥投稿哦,行哥撒幣
——— / 往期精選 / ————
後臺回覆「進羣」可以加入我們的社羣哦~