抖音視頻爬取

首先要用手機連接電腦或者安裝安卓模擬器,不斷刷新抖音,可以從Fiddle裏找到視頻接口,同時也要將Fiddle裏的Rules中的Customize Rules進行相應設置
在這裏插入圖片描述
上圖代碼爲:

    static function OnBeforeResponse(oSession: Session) {
	if (m_Hide304s && oSession.responseCode == 304) {
		oSession["ui-hide"] = "true";
	}
	if (oSession.uriContains("https://aweme-eagle-hl.snssdk.com/aweme/v1/")){
		var strBody=oSession.GetResponseBodyAsString();
		var sps = oSession.PathAndQuery.slice(-58,);
		//FiddlerObject.alert(sps)
		var curDate = new Date().getTime();   
		var filename = "C:/Users/Administrator/Desktop/抖音" + "/" + sps + curDate + ".json"; 
		var sw : System.IO.StreamWriter;  
		if (System.IO.File.Exists(filename)){  
			sw = System.IO.File.AppendText(filename);  
			sw.Write(strBody);  
		}  
		else{  
			sw = System.IO.File.CreateText(filename);  
			sw.Write(strBody);  
		}  
			
		sw.Close();  
		sw.Dispose();  
	}
    }

以下是在pycharm中進行編輯的代碼:

import json
import os
import requests
order=os.listdir(r'C:\Users\Administrator\Desktop\抖音') #打開文件夾
start_urls=[]#創建空列表
for file in order: #遍歷文件
    path=r'C:\Users\Administrator\Desktop\抖音\\'+file  #文件路徑
    with open(path,'r',encoding='utf-8')as f:
        data1=f.read()  
    data=json.loads(data1)  #讀取文件
    for ele in data['aweme_list']:  #遍歷視頻鏈接
        url=ele['video']['play_addr']['url_list']
        if url:
            start_urls.append(url[0])   #如果找到視頻鏈接,添加到創建的空列表裏
n=0
for i in start_urls:
    n+=1
    response=requests.get(i)
    with open('douyin/'+str(n)+'.mp4','wb')as f:
        f.write(response.content)   #保存視頻
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章