python 識別圖片上的數字

Python 3.6 版本 Pytesseract 圖像驗證碼識別

環境:

(1) win7 64位
(2) Idea
(3) python 3.6
(4) pip install pillow
<&nbsp>pip install pytesseract
(5) 識別引擎tesseract-ocr

安裝

安裝tesseract-ocr的識別引擎
第一步:下載安裝包
根據https://github.com/UB-Mannheim/tesseract/wiki,找到下載安裝包。
這裏寫圖片描述
我下載的是64位,根據自己需要下載
第二步:安裝
直接點擊下載好的tesseract-ocr-w64-setup-v4.0.0-beta.1.20180608.exe文件,點擊下一步,下一步,安裝完成。
第三步:配置環境變量
複製你安裝的路徑,我的是安裝在C:\Program Files (x86)\Tesseract-OCR,界面如下:
這裏寫圖片描述
進入“計算機/屬性”,點擊“高級系統設置”,點擊環境變量,找到path,點擊編輯,在末尾粘貼你剛纔複製的路徑,{粘貼時,你要給原有的信息末尾添加;分號}
這裏寫圖片描述
配置完畢後,點擊保存。

打開命令行windows + R 輸入cmd 打開 在命令行裏面輸入tesseract -v 配置成功會顯示當前的tesseract版本
這裏寫圖片描述

測試讀取圖片上的數字
這裏寫圖片描述
這裏寫圖片描述
KO!!!!!

出現問題:

解決方法:
添加環境變量內容
1.在環境變量裏面增加一個TESSDATA_PREFIX變量名,變量值還是安裝tesseract的路徑。我這裏還是放的我之前的路徑C:\Program Files (x86)\Tesseract-OCR;
2.修改python文件下的lib裏面生成的一個pytesseract.py文件
這裏寫圖片描述
這裏寫圖片描述
修改裏面的一個路徑內容:ps:(tesseract_cmd = ‘D:/Program Files/Tesseract-OCR/tesseract.exe’)網上也有人說是斜槓的問題,可以修改雙斜槓或者反斜槓
這裏寫圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章