OCR谷歌開源項目使用流程說明

轉自:http://blog.csdn.net/xuexiiphone/article/details/51252763

前提:使用Tesseract 進行字符解析工作

下載最新的Tesseract 安裝程序以及字符訓練集

中文訓練集網址:http://code.google.com/p/tesseract-ocr/downloads/detail?name=tesseract-ocr-3.02.chi_sim.tar.gz&can=2&q=

安裝程序下載最新版本:tesseract-ocr-setup-3.02.02.exe

網址:

http://code.google.com/p/tesseract-ocr/downloads/detail?name=tesseract-ocr-setup-3.02.02.exe&can=2&q=

安裝tesseract-ocr-setup-3.02.02.exe文件,默認路徑爲Cprogram filetesseract-ocr文件夾,文件夾中包含以下內容:

2013年09月12日 - 檸檬加冰 - 檸檬加冰的博客
 

tessdata文件夾中放入中文字符訓練集,chi_sim.traineddata

在命令行模式中進入到文件根目錄下,使用如下命令

2013年09月12日 - 檸檬加冰 - 檸檬加冰的博客
 

命令具體內容爲:tesseract.exe d:\1.jpg d:\output -l eng

語法爲:

tesseract.exe 【識別圖片路徑】 【識別結果txt文件名】 -l【選項值可以運行tesseract.exe /?查看】 【語言包,對應在tessdata目錄language.traineddata,可從官網下載沒有的語言包,或自己訓練】

最後在指定位置觀察解決處理的文件結果。


結束!!

發佈了24 篇原創文章 · 獲贊 29 · 訪問量 39萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章