5行Python實現驗證碼識別,太穩了!


    
    
    

大家好,我是小五🧐

在很久之前,分享過一次Python代碼實現驗證碼識別的辦法。

當時採用的是pillow+pytesseract,優點是免費,較爲易用。但其識別精度一般,若想要更高要求的驗證碼識別,初學者就只能去選擇使用百度API接口了。

但其實百度API接口和pytesseract其實都需要進行前期配置,對於初學者來說就不太友好了。

而且百度API必須要聯網,對於某些機器不能聯網的朋友而言,就得pass了

最近羣裏有位羣友分享了一個新庫,試用一下發現非常實用,特意今天分享給大家。

Github地址:https://github.com/sml2h3/ddddocr

該庫名也是非常有趣 —— ddddocr(諧音帶帶弟弟OCR)

環境要求

python >= 3.8
Windows/Linux/Macox..

可以通過以下命令安裝

pip install ddddocr

參數說明

在網上隨機尋找了一個驗證碼圖片,使用這個庫來實戰一下。

來源:百度搜索
import ddddocr

ocr = ddddocr.DdddOcr()
with open('1.png''rb'as f:
    img_bytes = f.read()
res = ocr.classification(img_bytes)

print(res)

成功識別出來了驗證碼文字!

而且優點也非常明顯:首先代碼非常精簡,對比前文提到的兩種方法,不需要額外設置環境變量等等,5行代碼即可輕鬆識別驗證碼圖片。另一方面,我們使用魔法命令%%time也測試出來嗎,這段代碼識別速度非常快。

下面用更多的驗證碼圖片繼續測試:

我又找了6個驗證碼圖片來測試,觀察結果,發現這類簡單的驗證碼基本可以進行快速識別。但也有部分結果有問題——字母大小寫沒有進行區分(比如第6張圖片)。

總而言之,如果你需要進行驗證碼識別,且對精度要求不是過高。

那麼,帶帶弟弟OCR(ddddocr)這個庫是一個不錯的選擇~

最近有啥書?

中文版Illustrator CC完全自學教程:本書以循序漸進的方式詳細講解了 Illustrator CC 軟件的基礎功能、核心功能、高級功能,以及在 UI 設計、字體設計、插畫繪製、Logo 設計和商業廣告設計等常見領域的應用。點擊即可查看詳情!👇

本文分享自微信公衆號 - 凹凸數據(alltodata)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章