輕量級OCR模型發佈,大小僅4MB

本模型適用於 https://github.com/kerlomz/captcha_platform 項目
基於最流行的CRNN識別單行文本,網上也有不少大佬們的項目,也提供了對應的模型,本項目旨在推廣通用圖像分類訓練框架,希望大家對他的用途不僅僅是用來識別驗證碼,它能有更大的作用。

CRNN

筆者使用的網絡爲筆者框架內置的CNNX+GRU+CTC組合,其實效果都大同小異。網上使用VGG的衆多,其實對於中文文檔類的簡單場景OCR,可以在特徵提取網絡上做一些適當的精簡。

CNNX網絡設計詳見:https://github.com/kerlomz/captcha_trainer/blob/master/network/CNN.py#L38

該模型使用 https://github.com/kerlomz/captcha_trainer 項目進行訓練
別看它以Captcha開頭,他並非專爲驗證碼而生,它也用於練普通的場景文字識別等,它其實是一個通用的圖像分類框架。
main.png

測試圖:

image.png
image.png
image.png
image.png

識別結果:

image.png

測試識別400x32尺寸的一張圖大概耗時20ms,300x32尺寸大概12ms。模型體積約4mb,包含了近6k的中英文符號的龐大字符集。足可謂是輕量級的OCR模塊了,大家可自行搭配文本目標檢測如CTPN,可將分割出的行圖片合成一個批次進行預測,可減少請求耗時。

模型使用:

使用 https://github.com/kerlomz/captcha_platform 項目進行部署:
將下載後的 common-ocr.zip 解壓,得到 graphmodel 兩個路徑。
放置於 captcha_platform 項目根目錄即可,若不想安裝環境可以使用鏈接中的編譯版進行部署。

Windows:
雙擊 captcha_platform_tornado.exe 或 使用命令行執行(若遇閃退)
image.png

Ubuntu:
使用./captcha_platform_tornado 啓動即可,可配合 nohup 後臺運行。
image.png

MacOS:
使用方法與Ubuntu一致。

模型下載:

鏈接: https://pan.baidu.com/s/1RBaSeSdp8QGdexXOTh4H4Q
提取碼:o97o

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章