[免費下載應用]iNeuKernel.Ocr 圖像數據識別與採集的產品化應用

目       錄

1..... 應用概述... 2

2..... 免費下載試用... 2

3..... 視頻介紹... 2

4..... iNeuLink.Ocr圖像數據採集應用... 2

5..... 數據上傳到iNeuOS工業互聯網操作系統... 4

6..... Ocr基本概念... 7

1.   應用概述

  在工業、軍工或航天等領域,有些設備及軟件系統比較陳舊,但是更換的成本比較高,在實驗或生產過程中不能夠完整的記錄數據,給數據應用和分析造成了很大的障礙,更無法解決實驗和生產人員的勞動強度

  通過OCR圖像識別的技術可以很好的解決上述問題,但是沒有一個完整的產品化的軟件實現操作級應用。儘管OCR技術相對比較成熟,除特定應用場景使用外,普及使用率並不高。

  iNeuKernel.Ocr圖像數據採集軟件,實現了實時自動獲得屏幕截圖或是應用程序截圖、動態增加數據識別標籤信息、後臺任務自動切片採集數據以及實時轉發數據,與iNeuOS工業互聯網操作系統互聯互通,完整數據採集、傳輸、存儲、視圖建模、分析等應用過程。示意如下圖:

2.   免費下載試用

  鏈接:https://pan.baidu.com/s/1joGfBefaBKiFJ1l08N3KZg

  提取碼:v242

3.   視頻介紹

   視頻介紹:iNeuKernel.Ocr 圖像數據識別與採集

4.   iNeuLink.Ocr圖像數據採集應用

(1)運行的主界面,應用相對簡單。如下圖:

  (2)配置圖源,可以使用快捷鍵,全屏截圖或是程序截圖,以便定位數據標籤的座標的相對位置,進行數據提取。如下圖:

  (3)增加或編輯識別標籤,單擊【數據識別】可以用紅色方框在圖源上標註要誤別的數據位置信息,在【數據識別結果】中可以看到識別數據的結果,並且填寫數據標籤名稱。如下圖:

  (4)轉發數據,可以把識別的數據結果轉發給其他系統,填寫站點編號、遠程IP、遠程Port轉發週期和是否啓用等信息。如下圖:

5.   數據上傳到iNeuOS工業互聯網操作系統

  下載iNeuOS離線安裝包,安裝過程參見:一鍵部署。進入系統後,選擇桌面【設備模型】,單擊左上角小加號圖標,增加一個新的設備。選擇【服務實例】後面的【編輯】按鈕鏈接,配置【基本設置】和【Socket】,【Socket】默認偵聽端口爲6699,其他信息一般不需要修改,如下圖:

     選擇配置好的【服務實例】,並且配置通訊類型、應用協議和選擇驅動等,配置如下圖:

     選擇左上角旋轉圖標,會重新啓動後臺服務,應用當前配置好的信息。硬件網關與iNeuOS平臺第一次通信時會同步網關的設備和數據點信息,會在當前iNeuOS設備驅動下生成子設備,在子設備上會有iNeuKernel硬件網關的數據點信息。如下圖:

    iNeuOS工業互聯網試用:試用地址

6.   Ocr基本概念

 (1)OCR的應用場景

   根據OCR的應用場景而言,我們可以大致分成識別特定場景下的專用OCR以及識別多種場景下的通用OCR。就前者而言,證件識別以及車牌識別就是專用OCR的典型案例。針對特定場景進行設計、優化以達到最好的特定場景下的效果展示。那通用的OCR就是使用在更多、更復雜的場景下,擁有比較好的泛性。在這個過程中由於場景的不確定性,比如:圖片背景極其豐富、亮度不均衡、光照不均衡、殘缺遮擋、文字扭曲、字體多樣等等問題,會帶來極大的挑戰。

 (2)OCR的技術路線

   典型的OCR技術路線如下圖所示:

   其中OCR識別的關鍵路徑在於文字檢測和文本識別部分,這也是深度學習技術可以充分發揮功效的地方。PaddleHub爲大家開源的預訓練模型的網絡結構是Differentiable Binarization+ CRNN,基於icdar2015數據集下進行的訓練。

   首先,DB是一種基於分割的文本檢測算法。在各種文本檢測算法中,基於分割的檢測算法可以更好地處理彎曲等不規則形狀文本,因此往往能取得更好的檢測效果。但分割法後處理步驟中將分割結果轉化爲檢測框的流程複雜,耗時嚴重。因此作者提出一個可微的二值化模塊(Differentiable Binarization,簡稱DB),將二值化閾值加入訓練中學習,可以獲得更準確的檢測邊界,從而簡化後處理流程。DB算法最終在5個數據集上達到了state-of-art的效果和性能。參考論文:Real-time Scene Text Detection with Differentiable Binarization

   下圖是DB算法的結構圖:

 

 

  接着,我們使用 CRNN(Convolutional Recurrent Neural Network)即卷積遞歸神經網絡,是DCNN和RNN的組合,專門用於識別圖像中的序列式對象。與CTC loss配合使用,進行文字識別,可以直接從文本詞級或行級的標註中學習,不需要詳細的字符級的標註。參考論文:An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition

   下圖是CRNN的網絡結構圖:

 


物聯網&大數據技術 QQ羣:54256083
物聯網&大數據項目 QQ羣:727664080
QQ:504547114
微信:wxzz0151
博客:https://www.cnblogs.com/lsjwq
微信公衆號:iNeuOS

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章