pyocr 官方網站:
https://gitlab.gnome.org/World/OpenPaperwork/pyocr
安裝:
pip install pyocr
上一篇文章也寫了:
https://blog.csdn.net/u013421629/article/details/84393691
搞了一張截圖命名爲1.png,下面來圖片文字識別下,藉助pyocr
識別情況:
本次圖片識別總共耗時4.474895000457764 s
近 日 , 一 裝 修 師 傅 在 湖 北 武 漢 沌 口 某 小 區 16 樓 進 行 高 空 作 業 時 , 因 不 慎 弄 髒
業 主 督 曬 的 衣 服 , 被 業 主 割 斷 備 用 安 全 繩 。 師 傅 下 跳 過 程 中 受 到 皮 外 傷 , 所
幸 未 釀 成 更 大 安 全 事 故 。 目 前 , 該 怒 氣 業 主 晉 某 已 被 行 政 拘 留 。 該 事 件 在 網
上 引 發 熱 議 , 涉 事 業 主 備 受 指 責 。
Process finished with exit code 0
# -*- encoding=utf-8 -*-
import pyocr.builders
import time
from PIL import Image,ImageEnhance
import pyocr.builders
# 初始化配置文件
tool = pyocr.get_available_tools()[0]
builder = pyocr.builders.TextBuilder()
langs = tool.get_available_languages()
lang = langs[0]
# 定義OCR圖片文字識別函數
def pic_orc(filepath,filename,resize_num,b):
"""
:param filepath: 文件路徑
:param filename:文件名稱
:return:文字識別
"""
time1 = time.time()
im = Image.open(str(filepath) + str(filename))
# 圖像放大
im = im.resize((im.width * int(resize_num), im.height * int(resize_num)))
# 圖像二值化
imgry = im.convert('L')
# 對比度增強
sharpness = ImageEnhance.Contrast(imgry)
sharp_img = sharpness.enhance(b)
txt =tool.image_to_string(sharp_img, lang=lang,builder=builder)
time2 = time.time()
print('本次圖片識別總共耗時%s s' % (time2 - time1))
return txt
if __name__ == '__main__':
filepath='F:/img_spam/test/'
filename='1.png'
resize_num = 2
b = 2.0
txt=pic_orc(filepath,filename,resize_num,b)
print(txt)