OCR圖像識別初體驗（一）

原創

2020-06-20 12:01

python使用庫：PIL pytesseract
主要輔助識別程序：Tesseract-OCR
個人踩坑經歷-實測有效
代碼塊：

from PIL import Image
import pytesseract
img = Image.open(r"F:\test\01.png")
text = pytesseract.image_to_string(img,lang='chi_sim')
print(text)

代碼很簡單，但是主要是Tesseract-OCR的安裝和 OCR漢化的安裝以及環境變量的配置

Tesseract-OCR 和漢化包資源下載：

鏈接：https://pan.baidu.com/s/1vqZVhu-WTeE-6zed1ZpoEg 
提取碼：lkkl 
複製這段內容後打開百度網盤手機App，操作更方便哦

一）
直接執行下載好的tesseract-ocr-setup-4.0.0-alpha.20180109.exe，下一步、下一步安裝。安裝過程中，會讓你安裝額外的語言包，可根據選擇下載。（不建議選擇，因爲是國外服務器，會下載失敗）

第三步：配置環境變量

我的是安裝在C:\Program Files (x86)\Tesseract-OCR，

將“C:\Program Files (x86)\Tesseract-OCR”添加到環境變量中

測試：
打開命令終端，輸入：tesseract -v，可以看到版本信息
用命令tesseract --list-langs來查看Tesseract-OCR支持語言。

設置漢化包：
一）
下載漢化壓縮包，githhub上下載太慢，下載不下來，網上找的資源，
下載雲盤裏的 tessdata.zip文件
二）
解壓縮後的所有文件複製到
Tesseract-OCR 下的 tessdata文件夾下
我的路徑是 C:\Program Files (x86)\Tesseract-OCR\tessdata，重複的文件跳過即可
三）
添加TESSDATA_PREFIX的環境變量，設置爲安裝目錄下的tessdata目錄
如:D:\Program Files (x86)\Tesseract-OCR\tessdata
設置了環境變量後需要重啓下才生效

執行前文代碼即可
‘’示例

識別結果

識別原圖

錯誤率有點兒高

附上其他相關學習鏈接：
1）https://zhuanlan.zhihu.com/p/30391661?utm_source=wechat_session&utm_medium=social&s_r=0
2）https://www.cnblogs.com/HL-space/p/10547259.html
3）https://mp.weixin.qq.com/s?__biz=MzIwNDA1OTM4NQ==&mid=2649543721&idx=1&sn=6ce719264e6f1fc9d407150362d0e14f&chksm=8edd93bfb9aa1aa986cf2a53fa2b4810665b57c344c4e7160be40d28fa20c9c4e0e728b3a511&mpshare=1&scene=1&srcid=&sharer_sharetime=1579184752640&sharer_shareid=626cc7814876b0a311c24ccf416cb880&rd2werd=1#wechat_redirect

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

OCR圖像識別初體驗（一）

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

企業大模型如何成爲自己數據的“百科全書”？

本地SSL證書過期輸入命令在IIS自動生成

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（二）使用kube-vip實現集羣VIP訪問

.NET週刊【5月第2期 2024-05-12】

datawhale學習小組 Task4：方差分析

Task3：常見分佈與假設檢驗

Task2：數理統計與描述性分析

Task1：隨機事件與隨機變量

python和PQ的完美結合——python批量刷新PQ工作簿模型

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結