【python 圖片文字識別】pyocr圖片文字識別

pyocr 官方網站:
https://gitlab.gnome.org/World/OpenPaperwork/pyocr

安裝:

pip install pyocr

上一篇文章也寫了:
https://blog.csdn.net/u013421629/article/details/84393691
搞了一張截圖命名爲1.png,下面來圖片文字識別下,藉助pyocr
在這裏插入圖片描述

識別情況:

本次圖片識別總共耗時4.474895000457764 s
近 日 , 一 裝 修 師 傅 在 湖 北 武 漢 沌 口 某 小 區 16 樓 進 行 高 空 作 業 時 , 因 不 慎 弄 髒
業 主 督 曬 的 衣 服 , 被 業 主 割 斷 備 用 安 全 繩 。 師 傅 下 跳 過 程 中 受 到 皮 外 傷 , 所
幸 未 釀 成 更 大 安 全 事 故 。 目 前 , 該 怒 氣 業 主 晉 某 已 被 行 政 拘 留 。 該 事 件 在 網
上 引 發 熱 議 , 涉 事 業 主 備 受 指 責 。

Process finished with exit code 0

在這裏插入圖片描述

# -*- encoding=utf-8 -*-
import pyocr.builders
import time
from PIL import Image,ImageEnhance
import pyocr.builders



# 初始化配置文件
tool = pyocr.get_available_tools()[0]
builder = pyocr.builders.TextBuilder()
langs = tool.get_available_languages()
lang = langs[0]

# 定義OCR圖片文字識別函數
def  pic_orc(filepath,filename,resize_num,b):
    """
    :param filepath: 文件路徑
    :param filename:文件名稱
    :return:文字識別
    """
    time1 = time.time()
    im = Image.open(str(filepath) + str(filename))
    # 圖像放大
    im = im.resize((im.width * int(resize_num), im.height * int(resize_num)))
    # 圖像二值化
    imgry = im.convert('L')
    # 對比度增強
    sharpness = ImageEnhance.Contrast(imgry)
    sharp_img = sharpness.enhance(b)
    txt =tool.image_to_string(sharp_img, lang=lang,builder=builder)
    time2 = time.time()
    print('本次圖片識別總共耗時%s s' % (time2 - time1))
    return txt



if __name__ == '__main__':
    filepath='F:/img_spam/test/'
    filename='1.png'
    resize_num = 2
    b = 2.0
    txt=pic_orc(filepath,filename,resize_num,b)
    print(txt)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章