抖音app爬取、最簡單測試一下爬取app的趕腳

註明:這個目的只是檢測你的app爬取環境,用一個最簡單的案例測試一下,體驗一下爬取app的趕腳。

1、需要工具:charles抓包工具,pycharm

2、配置好相關環境,打開手機抖音app,點擊一位用戶頭像,https://aweme-hl.snssdk.com中post就出現一個,點擊post,可以看到JavaScript中有她的全部信息顯示,由於看的不是太整體化,複製粘貼到json在線視圖查看器中,如下圖:可以看到有16個視頻的詳細信息

 

 

 

 

 

 

 

3、在pycharm中寫代碼,注意get_url()裏面要改成自己想爬取的那位,就是第一張圖的path,複製到

https://api.amemv.com/的後面,將我的那部分替換,參考了一位寫的代碼https://www.jianshu.com/p/7858aacf3930,可以去看看,當時我也是抱着試試的態度。
import requests
import urllib.request
import urllib3
def get_url(url):
    headers = {'user-agent': 'mobile'}
    #requests.packages.urllib3.disable_warnings()
    req = requests.get(url, headers=headers, verify=False)
    data = req.json()
    for data in data['aweme_list']:
        name = data['desc'] or data['aweme_id']
        url = data['video']['play_addr']['url_list'][0]
        urllib.request.urlretrieve(url, filename=name + '.mp4')
        print(name, url)

if __name__ == "__main__":
    get_url('https://api.amemv.com/aweme/v1/aweme/post/?max_cursor=0&sec_user_id=MS4wLjABAAAAnsfVdSNpR5jmjrVdW4iuWN-iAJowyvcMwMPkXw8YUFk&count=20&retry_type=no_retry&iid=87317341127&device_id=66867626703&ac=wifi&channel=ame_nubiamm&aid=1128&app_name=aweme&version_code=810&version_name=8.1.0&device_platform=android&ssmix=a&device_type=NX531J&device_brand=nubia&language=zh&os_api=23&os_version=6.0.1&openudid=3a25b00cb96f5147&manifest_version_code=810&resolution=1080*1920&dpi=480&update_version_code=8102&_rticket=1569418930996&mcc_mnc=46011&ts=1569418929&app_type=normal')

4、執行完上面的代碼,可以看到打印出來的信息,一共有17個,跟第一張圖片一樣,都是17個。並且在文件夾中也能看到下載出來呢。點擊其中任意一個url,就會跳轉到瀏覽器進行播放了。點擊的是第二個,與抖音app裏的視頻是一樣的。

5、到這裏抖音的最基本的測試已完成,有點小雞凍,害怕忘記,在這裏記錄一下。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章