0x01 簡介
百度己開發一個專注於高精度OCR識別的效率工具,識別的準確率及速度是決定產品可用性的關鍵因素。通過對比不同平臺的OCR識別產品,基於百度OCR通用文字識別能力進行開發,在滿足自己日常需求的同時,將這款產品提供給更多有需求的用戶使用,解決紙質文件電子化存檔、檢索、紙質書摘錄等多種場景下無法快速提取圖片內文字內容的問題,使文字信息的提取變得無比輕鬆。
0x02 創建應用
網址:https://console.bce.baidu.com/ai/
創建應用隨便填
記下AppID 、API Key、Secret Key,這三樣東西記下來,後期使用。
0x03 英文數字識別測試
如果已安裝pip,執行pip install baidu-aip即可。
識別效果差強人意,有部分驗證碼沒識別出來
另外百度還提供高精度版api識別,但是時間比通用版本長一些
ocr文檔:https://ai.baidu.com/ai-doc/OCR/3k3h7yeqa
0x04 中文識別測試
對於規整的中文識別較好