OCR圖像識別初體驗(一)

python使用庫:PIL pytesseract
主要輔助識別程序:Tesseract-OCR
個人踩坑經歷-實測有效
代碼塊:

from PIL import Image
import pytesseract
img = Image.open(r"F:\test\01.png")
text = pytesseract.image_to_string(img,lang='chi_sim')
print(text)

代碼很簡單,但是主要是Tesseract-OCR的安裝 和 OCR漢化的安裝以及環境變量的配置

Tesseract-OCR 和 漢化包資源下載:

鏈接:https://pan.baidu.com/s/1vqZVhu-WTeE-6zed1ZpoEg 
提取碼:lkkl 
複製這段內容後打開百度網盤手機App,操作更方便哦

一)
直接執行下載好的tesseract-ocr-setup-4.0.0-alpha.20180109.exe,下一步、下一步安裝。安裝過程中,會讓你安裝額外的語言包,可根據選擇下載。(不建議選擇,因爲是國外服務器,會下載失敗)

第三步:配置環境變量

我的是安裝在C:\Program Files (x86)\Tesseract-OCR,

將“C:\Program Files (x86)\Tesseract-OCR”添加到環境變量中

測試:
打開命令終端,輸入:tesseract -v,可以看到版本信息
用命令tesseract --list-langs來查看Tesseract-OCR支持語言。

設置漢化包:
一)
下載 漢化壓縮包,githhub上下載太慢,下載不下來,網上找的資源,
下載雲盤裏的 tessdata.zip文件
二)
解壓縮後的所有文件複製到
Tesseract-OCR 下的 tessdata文件夾下
我的路徑是 C:\Program Files (x86)\Tesseract-OCR\tessdata,重複的文件跳過即可
三)
添加TESSDATA_PREFIX的環境變量,設置爲安裝目錄下的tessdata目錄
如:D:\Program Files (x86)\Tesseract-OCR\tessdata
設置了環境變量後需要重啓下才生效

執行前文代碼即可
’示例

識別結果
在這裏插入圖片描述
識別原圖
在這裏插入圖片描述
錯誤率有點兒高

附上其他相關學習鏈接:
1)https://zhuanlan.zhihu.com/p/30391661?utm_source=wechat_session&utm_medium=social&s_r=0
2)https://www.cnblogs.com/HL-space/p/10547259.html
3)https://mp.weixin.qq.com/s?__biz=MzIwNDA1OTM4NQ==&mid=2649543721&idx=1&sn=6ce719264e6f1fc9d407150362d0e14f&chksm=8edd93bfb9aa1aa986cf2a53fa2b4810665b57c344c4e7160be40d28fa20c9c4e0e728b3a511&mpshare=1&scene=1&srcid=&sharer_sharetime=1579184752640&sharer_shareid=626cc7814876b0a311c24ccf416cb880&rd2werd=1#wechat_redirect

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章