OpenCV搞定騰訊滑塊驗證碼

前言

廢話
滑塊驗證碼破解是一直都想搞的項目,畢竟多數網站都會採用滑塊驗證碼,於是最近在修改論文的閒暇之餘把這事兒給解決了。要搞現在的滑塊驗證碼繞不開圖像處理,圖像處理當然是首推OpenCV-Python啦!當然我的OpenCV非常菜(P.S.兩天速成不敢保證代碼質量),發現問題就直接指出嘛,不用走流程啦!

環境
首先需要一個python,然後安裝opencv的python庫,如下:
pip install opencv-python
然後測試一下是否可用,如下:

import cv2 as cv
import numpy as np

if __name__ == '__main__':
    img = np.ones((200, 200, 3), np.uint8) * 255
    cv.rectangle(img, (50, 50), (150, 150), (0, 0, 255), 2)
    cv.imshow('test', img)
    cv.waitKey(0)
    cv.destroyAllWindows()

正常的話就會如下顯示:
圖片描述

OpenCV的使用
相關的API我也是邊用邊查的,用得也是相當生疏!具體的常用方法大家只好自行百度了,我就不獻醜了!

實現原理及方法

騰訊滑塊驗證
這次搞得目標就是騰訊滑塊驗證碼,調用騰訊滑塊這個接口的網站還是挺多的,比如非常好用的在線畫圖網站ProcessOn,其中滑塊驗證部分類似這樣子的:
圖片描述

抓個包發現只有滑塊圖和帶缺口的圖,如下:
圖片描述
破解滑塊驗證碼最爲關鍵的地方在於找到滑塊缺口的位置,找到缺口位置後就可以利用Selenium模擬拖動滑塊到指定位置實現破解,之前的老辦法就是將完整圖的像素點和帶缺口圖的像素點進行比較從而得到缺口位置,但是現在一般不會將完整圖暴露給我們,所以只有在帶有缺口的圖上進行處理。我這裏一共有兩種方案進行缺口位置識別,一種是基於模板匹配的,另一種是基於輪廓檢測的,下面會細講兩種方案的實現方法。

模板匹配識別缺口
具體是實現過程如下:
1.處理滑塊的圖片

  • 灰度化滑塊圖片
  • 處理一下滑塊圖中滑塊的外圈
  • 使用inRange二值化滑塊圖
  • 使用開運算去除白色噪點

運行結果如下所示(左側爲原始滑塊,右側爲處理後的滑塊):
圖片描述

2.處理帶缺口的圖片

  • 先來個高斯濾波去噪
  • 灰度化帶缺口圖
  • 使用閾值二值化該圖

運行結果如下所示(左側爲原始圖,右側爲處理後的圖):
圖片描述

3.進行模板匹配
調用模板匹配API並圈出匹配上的區域,結果如下所示:
圖片描述

警告警告警告
這種方法的缺口識別率在50%左右,很大一部分原因是滑塊圖的背景爲純白色,這在匹配時會產生很大的干擾,要是能將滑塊圖的背景變爲透明,正確的匹配率可以達到90%以上

如果大家有任何將滑塊圖的背景變爲透明的辦法,可以留言到評論區,我真的萬分感謝!!!下面是現階段的實現代碼:

# encoding:utf-8
import cv2 as cv
import numpy as np


# 對滑塊進行二值化處理
def handle_img1(image):
    kernel = np.ones((8, 8), np.uint8)  # 去滑塊的前景噪聲內核
    gray = cv.cvtColor(image, cv.COLOR_BGR2GRAY)
    width, heigth = gray.shape
    for h in range(heigth):
        for w in range(width):
            if gray[w, h] == 0:
                gray[w, h] = 96
    # cv.imshow('gray', gray)
    binary = cv.inRange(gray, 96, 96)
    res = cv.morphologyEx(binary, cv.MORPH_OPEN, kernel)  # 開運算去除白色噪點
    # cv.imshow('res', res)
    return res


# 模板匹配(用於尋找缺口有點誤差)
def template_match(img_target, img_template):
    tpl = handle_img1(img_template)  # 誤差來源就在於滑塊的背景圖爲白色
    blurred = cv.GaussianBlur(img_target, (3, 3), 0)  # 目標圖高斯濾波
    gray = cv.cvtColor(blurred, cv.COLOR_BGR2GRAY)
    ret, target = cv.threshold(gray, 127, 255, cv.THRESH_BINARY)  # 目標圖二值化
    # cv.imshow("template", tpl)
    # cv.imshow("target", target)
    method = cv.TM_CCOEFF_NORMED
    width, height = tpl.shape[:2]
    result = cv.matchTemplate(target, tpl, method)
    min_val, max_val, min_loc, max_loc = cv.minMaxLoc(result)
    left_up = max_loc
    right_down = (left_up[0] + height, left_up[1] + width)
    cv.rectangle(img_target, left_up, right_down, (0, 0, 255), 2)
    cv.imshow('res', img_target)


if __name__ == '__main__':
    img0 = cv.imread('./demo/3/hycdn_3.jpg')
    img1 = cv.imread('./demo/3/hycdn_3_2.png')
    template_match(img0, img1)
    cv.waitKey(0)
    cv.destroyAllWindows()

輪廓檢測識別缺口
基於輪廓檢測缺口的思路簡單很多,加上合理的條件識別率在95%以上,實現過程如下:

  • 帶缺口圖高斯模糊去噪
  • (200,400)的閾值做Canny邊緣檢測
  • 尋找輪廓
  • 對已有的輪廓做約束,比如輪廓的面積範圍,輪廓的周長範圍

多個匹配結果如下:
圖片描述
圖片描述
圖片描述
圖片描述

實現代碼如下:

# encoding:utf-8
import cv2 as cv


def get_pos(image):
    blurred = cv.GaussianBlur(image, (5, 5), 0)
    canny = cv.Canny(blurred, 200, 400)
    contours, hierarchy = cv.findContours(canny, cv.RETR_EXTERNAL, cv.CHAIN_APPROX_SIMPLE)
    for i, contour in enumerate(contours):
        M = cv.moments(contour)
        if M['m00'] == 0:
            cx = cy = 0
        else:
            cx, cy = M['m10'] / M['m00'], M['m01'] / M['m00']
        if 6000 < cv.contourArea(contour) < 8000 and 370 < cv.arcLength(contour, True) < 390:
            if cx < 400:
                continue
            x, y, w, h = cv.boundingRect(contour)  # 外接矩形
            cv.rectangle(image, (x, y), (x + w, y + h), (0, 0, 255), 2)
            cv.imshow('image', image)
            return x
    return 0


if __name__ == '__main__':
    img0 = cv.imread('./demo/4/hycdn_4.jpg')
    get_pos(img0)
    cv.waitKey(0)
    cv.destroyAllWindows()

遺留問題

問題1
如何將滑塊圖的純白背景變爲透明背景?

問題2
使用Selenium和軌跡算法拖動滑塊時將滑塊拖出左側的範圍之外,軌跡算法是先加速後減速整體是向前移動的,按道理來說不可能往回走,但是模擬拖動的時候會出現滑塊向後拖動且拖出範圍的現象,這問題如何解決?
圖片描述

有知道上述問題如何解決的小夥伴,期待你的留言或評論!!!

END

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章