Free OCR Softwares
- Google's & HP's Tesseract
- Google's Keep
- Microsoft Document Imaging ( MODI ) ( assuming majority of us would be having a windows OS )
- Microsoft One Note
- Microsoft Oxford Project API ( This API is free until some time )
- FreeOCR ( This is based on Tesseract engine again )
Commercial Products
- Adobe Acrobat Pro ( RTF file format gives you best result )
- Captiva
- Abbyy
- Informatica ( Not sure which module within Informatica )
- IBM Datacapture (Datacap) (IBM Watson)
優秀的開源OCR軟件包括:
Tesseract
原本由惠普開發的圖像識別類庫tesseract-ocr已經更新到2.04, 就是最近Google支持的那個OCR。原先是惠普寫的,現在Open source了。
OCRopus
Ocropus的(TM)是一個先進的文件分析和OCR系統,採用可插入的佈局分析,可插入的字符識別,自然語言統計建模和多語言支持功能。
Cuneiform
Cuneiform 是一個 OCR 文字識別系統的商標,最開始是由Cognitive 技術所開發的運行在 Windows 下的軟件。而這個項目是該軟件在 Linux 系統下的移植版本。
GOCR
GOCR 是一個開源的OCR光學識別程序。
Tesseract
原本由惠普開發的圖像識別類庫tesseract-ocr已經更新到2.04, 就是最近Google支持的那個OCR。原先是惠普寫的,現在Open source了。
OCRopus
Ocropus的(TM)是一個先進的文件分析和OCR系統,採用可插入的佈局分析,可插入的字符識別,自然語言統計建模和多語言支持功能。
Cuneiform
Cuneiform 是一個 OCR 文字識別系統的商標,最開始是由Cognitive 技術所開發的運行在 Windows 下的軟件。而這個項目是該軟件在 Linux 系統下的移植版本。
GOCR
GOCR 是一個開源的OCR光學識別程序。
OCRFeeder
OCRFeeder 是 GNOME 桌面下的一個開源 OCR 套件。可將紙質或者圖形文檔轉成電子文檔。
Lios
linux-intelligent-ocr-solution (Lios) 是Linux下一個開源的 OCR 解決方案,可將打印的文檔轉成可編輯的文本。
OCRFeeder 是 GNOME 桌面下的一個開源 OCR 套件。可將紙質或者圖形文檔轉成電子文檔。
Lios
linux-intelligent-ocr-solution (Lios) 是Linux下一個開源的 OCR 解決方案,可將打印的文檔轉成可編輯的文本。
清華紫光OCR
尚書七號
ABBYY FineReader OCR
Leadtools Ocr
漢王
尚書七號
ABBYY FineReader OCR
Leadtools Ocr
漢王
文通
賽酷OCR
Expervision,Inc OCR
丹青
賽酷OCR
Expervision,Inc OCR
丹青