輕量級OCR模型發佈，大小僅4MB

原創

2020-06-10 11:55

本模型適用於 https://github.com/kerlomz/captcha_platform 項目
基於最流行的CRNN識別單行文本，網上也有不少大佬們的項目，也提供了對應的模型，本項目旨在推廣通用圖像分類訓練框架，希望大家對他的用途不僅僅是用來識別驗證碼，它能有更大的作用。

CRNN

筆者使用的網絡爲筆者框架內置的CNNX+GRU+CTC組合，其實效果都大同小異。網上使用VGG的衆多，其實對於中文文檔類的簡單場景OCR，可以在特徵提取網絡上做一些適當的精簡。

CNNX網絡設計詳見：https://github.com/kerlomz/captcha_trainer/blob/master/network/CNN.py#L38

該模型使用 https://github.com/kerlomz/captcha_trainer 項目進行訓練
別看它以Captcha開頭，他並非專爲驗證碼而生，它也用於練普通的場景文字識別等，它其實是一個通用的圖像分類框架。

測試圖：

識別結果：

測試識別400x32尺寸的一張圖大概耗時20ms，300x32尺寸大概12ms。模型體積約4mb，包含了近6k的中英文符號的龐大字符集。足可謂是輕量級的OCR模塊了，大家可自行搭配文本目標檢測如CTPN，可將分割出的行圖片合成一個批次進行預測，可減少請求耗時。

模型使用：

使用 https://github.com/kerlomz/captcha_platform 項目進行部署：
將下載後的 common-ocr.zip 解壓，得到 graph 和 model 兩個路徑。
放置於 captcha_platform 項目根目錄即可，若不想安裝環境可以使用鏈接中的編譯版進行部署。

Windows:
雙擊 captcha_platform_tornado.exe 或使用命令行執行（若遇閃退）

Ubuntu:
使用./captcha_platform_tornado 啓動即可，可配合 nohup 後臺運行。

MacOS:
使用方法與Ubuntu一致。

模型下載：

鏈接: https://pan.baidu.com/s/1RBaSeSdp8QGdexXOTh4H4Q
提取碼：o97o

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

輕量級OCR模型發佈，大小僅4MB

CRNN

測試圖：

識別結果：

模型使用：

模型下載：

ollama使用

Window 安裝 Python 失敗 0x80070643，發生嚴重錯誤

TiDB Vector 太香啦：以圖搜圖初體驗！

《最新出爐》系列入門篇-Python+Playwright自動化測試-41-錄製視頻

【源碼】某度貼吧驗證碼識別

【2020.06】國稅總局發票查驗平臺驗證碼最新獲取方法

微軟/Hotmail驗證碼識別97%識別率方案

【含17w樣本】搜狗驗證碼識別

南航驗證碼識別方案

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結