python3.7 安装PIL识别图片中文字

前提:
本人开发环境是windows7 旗舰版 64位系统
python -V
Python 3.7.3
pip -V
pip 20.0.2 from d:\software\python\lib\site-packages\pip (python 3.7)

问题一:
python不是内部或外部命令的解决方法
https://jingyan.baidu.com/article/fc07f989a830d012ffe5191e.html(照葫芦画瓢时间到)
问题二(python3 pip升级命令):
基于python3开发用pip安装插件时候要求pip 版本为20.0.2(因人而异)
python -m pip install --upgrade pip
问题三:
卸载PIP的命令:python -m pip uninstall pip
重装PIP的命令:easy_inatall pip
升级PIP的命令:python -m pip install --upgrade pip
卸载pip的命令行安装的插件:pip uninstall 插件名在这里插入图片描述
查看所有安装已安装插件:pip list
在这里插入图片描述
问题四:
安装python插件时候总是总是安装不上,安装不上的猜测原因一:你的网速不好 原因二:有可能跟安装镜像源有关(本人猜测)
解决办法:
pip install 插件名 -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
更多信息查看
总结:
python中每个版本对于插件的要求各不相同,对于初学者而言一开始装插件时候经常装不上都是正常的,报错一连串,需要更细心、耐心一点查看报错信息,在python中如果你想使用一个插件,不仅需要安装插件还需要下载一些辅助的资源才可以使用相应的插件,例如:PIL(Pillow)、pdfkit等插件是都需要下载相应的辅助资源

正题:
pillow是PIL的一个分支,虽是分支但是其与PIL同样也具有很强的图像处理库。
第一步: 安装Pillow、pytesseract插件

  1. pip install Pillow (pip install Pillow -i http://pypi.douban.com/simple --trusted-host pypi.douban.com)
  2. pip install pytesseract

第二步:安装tesseract-ocr
1》
方法一:github地址: https://github.com/tesseract-ocr/tesseract
进去选择wiki,在选择对应的版本即可。安装时默认只有一个eng的识别库,可以勾选想要添加的库,或者自己单独下载后放到安装文件夹tessdata下。我找了半天太。。。nan。。。le
https://tesseract-ocr.github.io/tessdoc/Home.html
在这里插入图片描述
方法二:在这里选择适合自己的版本
https://digi.bib.uni-mannheim.de/tesseract

2》傻瓜式安装tesseract-ocr-xxx.exe
在这里插入图片描述
3》配置tesseract.exe到环境变量PATH中
验证tesseract命令是否配置成功
tesseract -v在这里插入图片描述
4》修改python中的pytesseract.py文件
在这里插入图片描述
修改部分如下:
在这里插入图片描述

第三步:测试demo

import pytesseract
from PIL import Image

image = Image.open("../img/eng.png")
code = pytesseract.image_to_string(image,lang="eng")
print(code)

在这里插入图片描述
扩展:
当想识别图片中中文时就会报错,这时就需要引入新的语言库,tesseract中只有二种语言包
在这里插入图片描述
在这里插入图片描述
语言库下载地址:https://github.com/tesseract-ocr/tessdata
在这里插入图片描述
将下载下来的语言包放到改路径下即可,放完之后可以输入tesseract --list-langs验证是否成功
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

import pytesseract
from PIL import Image

image = Image.open("../img/4.png")
code = pytesseract.image_to_string(image,lang="chi_sim")
print(code)

任何插件都有自身缺陷,所以。。。。
有什么大家不理解,赶紧问我免得我老是忘记,好哈哈哈哈

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章