Python使用百度Api實現OCR識別

0x01 簡介

百度己開發一個專注於高精度OCR識別的效率工具,識別的準確率及速度是決定產品可用性的關鍵因素。通過對比不同平臺的OCR識別產品,基於百度OCR通用文字識別能力進行開發,在滿足自己日常需求的同時,將這款產品提供給更多有需求的用戶使用,解決紙質文件電子化存檔、檢索、紙質書摘錄等多種場景下無法快速提取圖片內文字內容的問題,使文字信息的提取變得無比輕鬆。

0x02 創建應用

網址:https://console.bce.baidu.com/ai/
在這裏插入圖片描述
創建應用隨便填
在這裏插入圖片描述

在這裏插入圖片描述

記下AppID 、API Key、Secret Key,這三樣東西記下來,後期使用。

0x03 英文數字識別測試

如果已安裝pip,執行pip install baidu-aip即可。

在這裏插入圖片描述

在這裏插入圖片描述

在這裏插入圖片描述
識別效果差強人意,有部分驗證碼沒識別出來
另外百度還提供高精度版api識別,但是時間比通用版本長一些

ocr文檔:https://ai.baidu.com/ai-doc/OCR/3k3h7yeqa

0x04 中文識別測試

在這裏插入圖片描述
對於規整的中文識別較好

0x05 源碼

源碼在這:https://github.com/SaltNego/Python3Spider

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章