今天 Gitee 爲大家介紹的是一款中文 OCR 包。大家都知道,訓練模型是一件非常費時費力的事情,但今天這款項目已經自帶訓練好的識別模型,我們只需要下載下來使用即可,可以說是非常方便了,那麼下面我們就去看看這個項目的詳細信息吧。
項目名稱:cnocr
項目作者:cyahua
開源許可協議:Apache-2.0
項目地址:https://gitee.com/cyahua/cnocr
項目簡介
cnocr是用來做中文OCR的Python 3包。cnocr自帶了訓練好的識別模型,安裝後即可直接使用。
cnocr主要針對的是排版簡單的印刷體文字圖片,如截圖圖片,掃描件等。cnocr目前內置的文字檢測和分行模塊無法處理複雜的文字排版定位。如果要用於場景文字圖片的識別,需要結合其他的場景文字檢測引擎使用。
示例
可直接使用的模型
cnocr的ocr模型可以分爲兩階段:第一階段是獲得ocr圖片的局部編碼向量,第二部分是對局部編碼向量進行序列學習,獲得序列編碼向量。目前兩個階段分別包含以下的模型:
- 局部編碼模型(emb model)
conv
:多層的卷積網絡;conv-lite
:更小的多層卷積網絡;densenet
:一個小型的densenet
網絡;densenet-lite
:一個更小的densenet
網絡。
- 序列編碼模型(seq model)
lstm
:兩層的LSTM網絡;gru
:兩層的GRU網絡;fc
:兩層的全連接網絡。
cnocr目前包含以下可直接使用的模型,訓練好的模型都放在 cnocr-models 項目中,可免費下載使用:
特色
本項目的初期代碼fork自 crnn-mxnet-chinese-text-recognition,感謝作者。
但源項目使用起來不夠方便,所以我在此基礎上做了一些封裝和重構。主要變化如下:
- 不再使用需要額外安裝的MXNet WarpCTC Loss,改用原生的 MXNet CTC Loss。所以安裝極簡!
- 自帶訓練好的中文OCR識別模型。不再需要額外訓練!
- 增加了預測(或推斷)接口。所以使用方便!
如果你對這個項目感興趣,想要親自試一試識別的效果的話,可以點擊後面的鏈接前往項目主頁看看,如果覺得不錯記得給它一個 Star 哦:https://gitee.com/cyahua/cnocr