Xpanx | Python幫你下載抖音上小姐姐的照片

目標場景

相信大家平時刷抖音短視頻的時候，看到顏值高的小姐姐，都有隨手點贊關注的習慣。

如果一條條去刷確實很耗時間，如果 Python 能幫忙篩選出顏值高的小姐姐那就省了很多事。

本篇文章是藉助「百度人臉識別」API，幫我們識別出抖音上顏值高的小姐姐，然後下載到手機相冊中。

準備工作

首先，項目需要對頁面元素進行一些精準的操作，需要提前準備一部 Android 設備，激活開發者選項，並在開發者選項中打開「USB 調試和指針位置」兩處設置。

爲了確保 adb 命令能正常使用，需要提前配置好 adb 開發環境。

頁面元素中的部分元素沒法利用 name 等常用屬性獲取到，可能需要獲取到完整的「UI 樹」，再利用 Airtest 判斷是否存在某個 UI 元素。

# 安裝依賴pip3 install pocoui

另外，項目中會對視頻進行人臉識別，獲取到出現的所有人臉，再進行性別識別及顏值判斷。

這裏需要進行百度雲後臺，註冊一個人臉識別的應用，獲取到一組「API Key 和 Secret Key」值。

https://console.bce.baidu.com

然後利用官網提供的 API 文檔即可獲取到「access token」，由於 ak 的有效期爲一個月，所以只需要初始化一次，後面就可以利用人臉識別接口進行正常的識別了。

appid = '你註冊應用的appid'
api_key = '你註冊應用的ak'
secret_key = '你註冊應用的sk'

def get_access_token():
    """
     其中access_token有效期一般有一個月
    """
    # 此變量賦值成自己API Key的值
    client_id = api_key  

    # 此變量賦值成自己Secret Key的值
    client_secret = secret_key  

    auth_url = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' + client_secret

    header_dict = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Trident/7.0; rv:11.0) like Gecko',
                   "Content-Type": "application/json"}

    # 請求獲取到token的接口
    response_at = requests.get(auth_url, headers=header_dict)
    json_result = json.loads(response_at.text)
    access_token = json_result['access_token']
    return access_token

編寫腳本

在上面已經配置好了 adb 環境的情況下，可以直接藉助 python 中的 os 模塊執行 adb 命令打開抖音 App。

# 抖音App的應用包名和初始Activity
package_name = 'com.ss.android.ugc.aweme'
activity_name = 'com.ss.android.ugc.aweme.splash.SplashActivity'

def start_my_app(package_name, activity_name):
    """
    打開應用
    adb shell am start -n com.tencent.mm/.ui.LauncherUI
    :param package_name:
    :return:
    """
    os.popen('adb shell am start -n %s/%s' % (package_name, activity_name))

接着，我們需要截取當前播放視頻的截圖到本地。

需要注意的是，抖音視頻播放界面包含視頻創作者頭像、BGM 創作者頭像等一些雜亂的元素，可能對人臉識別的結果產生一些誤差，所以需要對屏幕截圖之後的圖像進行「二次裁剪」處理。

def get_screen_shot_part_img(image_name):
    """
    獲取手機截圖的部分內容
    :return:
    """
    # 截圖
    os.system("adb shell /system/bin/screencap -p /sdcard/screenshot.jpg")
    os.system("adb pull /sdcard/screenshot.jpg %s" % image_name)

    # 打開圖片
    img = Image.open(image_name).convert('RGB')

    # 圖片的原寬、高(1080*2160)
    w, h = img.size

    # 截取部分，去掉其頭像、其他內容雜亂元素
    img = img.crop((0, 0, 900, 1500))

    img.thumbnail((int(w / 1.5), int(h / 1.5)))

    # 保存到本地
    img.save(image_name)

    return image_name

現在可以使用百度提供的 API 獲取到上面截圖的人臉列表。

def parse_face_pic(pic_url, pic_type, access_token):
    """
    人臉識別
    5秒之內
    :param pic_url:
    :param pic_type:
    :param access_token:
    :return:
    """
    url_fi = 'https://aip.baidubce.com/rest/2.0/face/v3/detect?access_token=' + access_token

    # 調用identify_faces，獲取人臉列表
    json_faces = identify_faces(pic_url, pic_type, url_fi)

    if not json_faces:
        print('未識別到人臉')
        return None
    else:
        # 返回所有的人臉
        return json_faces

從上述的人臉列表中篩選出性別爲女，年齡爲 18-30 歲之間，顏值超過 70 的小姐姐。

def analysis_face(face_list):
    """
    分析人臉，判斷顏值是否達標
    18-30之間，女，顏值大於80
    :param face_list:識別的臉的列表
    :return:
    """
    # 是否能找到高顏值的美女
    find_belle = False
    if face_list:
        print('一共識別到%d張人臉，下面開始識別是否有美女~' % len(face_list))
        for face in face_list:
            # 判斷是男、女
            if face['gender']['type'] == 'female':
                age = face['age']
                beauty = face['beauty']

                if 18 <= age <= 30 and beauty >= 70:
                    print('顏值爲:%d,及格，滿足條件！' % beauty)
                    find_belle = True
                    break
                else:
                    print('顏值爲:%d,不及格，繼續~' % beauty)
                    continue
            else:
                print('性別爲男,繼續~')
                continue
    else:
        print('圖片中沒有發現人臉.')

    return find_belle

由於視頻是連續播放的，很難通過截取視頻某一幀，判斷視頻有出現顏值高的小姐姐。

另外，大部分短視頻播放時長爲「10s+」，這裏需要對每一個視頻多次截圖去做人臉識別，直到識別到顏值高的小姐姐。

# 一條視頻最長的識別時間RECOGNITE_TOTAL_TIME = 10 # 識別次數
recognite_count = 1

# 對當前視頻截圖去人臉識別
while True:
  # 獲取截圖
  print('開始第%d次截圖' % recognite_count)

  # 截取屏幕有用的區域，過濾視頻作者的頭像、BGM作者的頭像
  screen_name = get_screen_shot_part_img('images/temp%d.jpg' % recognite_count)

  # 人臉識別
  recognite_result = analysis_face(parse_face_pic(screen_name, TYPE_IMAGE_LOCAL, access_token))

  recognite_count += 1

  # 第n次識別結束後的時間
  recognite_time_end = datetime.now()

  # 這一條視頻出現了顏值高的小姐姐
  if recognite_result:
         pass
  else:
         print('超時！！！這是一條沒有吸引力的視頻！')
         # 跳出裏層循環
         break

一旦當前播放的視頻識別出有顏值高的小姐姐，就需要模擬保存視頻到本地的操作。

獲取「分享」和「保存本地」兩個按鈕的座標位置，依次利用 adb 執行點擊操作即可下載視頻到本地。

def save_video_met():
    """
    :return:
    """
    # 分享
    os.system("adb shell input tap 1000 1500")
    time.sleep(0.05)

    # 保存到本地
    os.system("adb shell input tap 350 1700")

另外，由於下載視頻的過程是一個耗時操作，在下載進度對話框還未消失之前，需要做一個「模擬等待」的操作。

def wait_for_download_finished(poco):
    """
    從點擊下載，到下載完全
    :return:
    """

    element = Element()
    while True:
        # 由於是對話框，不能利用Element類來判斷是否存在某個元素來準確處理
        # element_result = element.findElementByName('正在保存到本地')

        # 當前頁面UI樹元素信息
        # 注意：保存的時候可能會獲取元素異常，這裏需要拋出，並終止循環
        # com.netease.open.libpoco.sdk.exceptions.NodeHasBeenRemovedException: Node was no longer alive when query attribute "visible". Please re-select.
        try:
            ui_tree_content = json.dumps(poco.agent.hierarchy.dump(), indent=4).encode('utf-8').decode('unicode_escape')
        except Exception as e:
            print(e)
            print('異常，按下載處理~')
            break

        if '正在保存到本地' in ui_tree_content:
            print('還在下載中~')
            time.sleep(0.5)
            continue
        else:
            print('下載完成~')
            break

在視頻保存到本地之後，就可以模擬向上滑動的操作，跳到播放「下一條視頻」。

循環上面的操作，即可篩選出所有顏值高的小姐姐，並保存到本地。

def play_next_video():
    """
    下一個視頻
    從下往上滑動
    :return:
    """
    os.system("adb shell input swipe 540 1300 540 500 100")

在腳本一條條刷視頻的過程中，可能會遇到一下廣告，我們需要對這類視頻進行過濾。

def is_a_ad():
    """
    判斷的當前頁面上是否是一條廣告
    :return:
    """
    element = Element()
    ad_tips = ['去玩一下', '去體驗', '立即下載']

    find_result = False

    for ad_tip in ad_tips:
        try:
            element_result = element.findElementByName(ad_tip)
            # 是一條廣告,直接跳出
            find_result = True
            break
        except Exception as e:
            find_result = False

    return find_result

結果結論

運行上面的腳本，會自動打開抖音，對每一條小視頻多次進行人臉識別，直到識別到顏值高的小姐姐，保存視頻到本地，然後繼續刷下一條短視頻。

Xpanx | Python幫你下載抖音上小姐姐的照片

《Python進階》學習筆記

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

Xpanx | Python幫你下載抖音上小姐姐的照片

Python爬蟲JD杜蕾斯源碼

【Python爬蟲】| XPANX獲取抖音APP小視屏

xpanx原理解析 | 只要 3 秒！抖音視頻無水印下載

抖音無水印下載python爬蟲學習小案例：爬取抖音小姐姐視頻

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結