私有化部署文字識別SDK

表格表單是一種高度精煉,集中的信息表達手段,紙質表格被廣泛的應用於數據採集,將紙質表格數據轉換成電子數據是信息化必然趨勢。傳統的人工數據錄入方式效率低下、差錯率高、成本昂貴,北京文通科技結合其在OCR(光學字符識別)領域的尖端技術,爲客戶提供企業級的數據採集方案,在數據採集和數據應用之間架起高速通道。可與Excel表,與企事業單位的ERP、CRM等系統實現無縫結合。系統支持中英文、數字、符號等多類型字符的手寫體、印刷體識別.
在這裏插入圖片描述
傳統的人工數據錄入方式,這是目前企業使用最多最直接的方式,由專門的數據錄入員將數據一條一條錄入計算機存儲,數據流向企業ERP系統、Excel記錄型表格。這種方式耗費了大量的人力和時間,計算機在此方案中只是數據載體,並未高效應用,弊端顯而易見:

1、錄單任務繁重、強度大、錄入員在高強度重複工作狀態下極易疲勞出錯;

2、增加錄單人手、增加計算機設備都導致辦公成本增加;

3、基礎數據採集效率低下導致綜合統計數據滯後,導致公司的其他業務信息管理系統(如ERP、CRM)所發揮的性能大打折扣,從而影響企業正確決策。

使用OCR技術實現自動錄單,目前部分ERP軟件商集成了OCR(光學字符識別)技術,通過批量掃描識別的方式採集表單、訂單數據,大大提高數據採集的效率。OCR識別錄單方式是對傳統錄入方式的一個顛覆。

基於先進的圖像處理、OCR&ICR(智能字符識別)技術,把繁重重複的工作交給計算機去處理,充分發揮了計算機處理技術的優勢,錄單主體的變更帶來的是錄單效率本質的提高,這也是OCR技術的初衷。簡單舉例,一張A4訂單中有15條數據,熟練錄入員錄單需要120秒,而OCR技術僅需要1.5秒,速率提高是120S/1.5S = 79倍,優勢極爲明顯。

可識別字符類型有1. 印刷體:中文(簡繁體)、英文、數字2.手寫體:中文(簡繁體)、英文、數字3.符號類:標識碼、條碼、 CheckBox、╳、▇、、等,可定製符號,8種可定製字符:日、韓、蒙古、藏、維吾爾、哈薩克、柯爾克孜、阿拉伯文。單張表格的識別速度在 1 秒鐘左右;識別率在對於版面整潔的印刷字符的識別,正確率達99.96%;對於規範手寫數字、英文的識別,正確率達98.5%;對於規範手寫漢字的識別,正確率在 85%左右;

SDK主要模塊及功能特點

表格模板編輯器:輕鬆快速定義識別模板;

圖像預處理模塊:自動去黑邊、自動糾偏、去噪聲、圖像自動旋轉、多種二值化方法處理;

表格自動分類:系統能自動區分當前表格、票據的業務類別,實現全自動歸檔;

發佈了13 篇原創文章 · 獲贊 10 · 訪問量 1萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章