【python 圖片文字識別】pyocr圖片文字識別

原創

2019-01-17 21:24

pyocr 官方網站：
https://gitlab.gnome.org/World/OpenPaperwork/pyocr

安裝：

pip install pyocr

上一篇文章也寫了：
https://blog.csdn.net/u013421629/article/details/84393691
搞了一張截圖命名爲1.png，下面來圖片文字識別下，藉助pyocr

識別情況：

本次圖片識別總共耗時4.474895000457764 s
近 日 , 一 裝 修 師 傅 在 湖 北 武 漢 沌 口 某 小 區 16 樓 進 行 高 空 作 業 時 , 因 不 慎 弄 髒
業 主 督 曬 的 衣 服 , 被 業 主 割 斷 備 用 安 全 繩 。 師 傅 下 跳 過 程 中 受 到 皮 外 傷 , 所
幸 未 釀 成 更 大 安 全 事 故 。 目 前 , 該 怒 氣 業 主 晉 某 已 被 行 政 拘 留 。 該 事 件 在 網
上 引 發 熱 議 , 涉 事 業 主 備 受 指 責 。

Process finished with exit code 0

# -*- encoding=utf-8 -*-
import pyocr.builders
import time
from PIL import Image,ImageEnhance
import pyocr.builders



# 初始化配置文件
tool = pyocr.get_available_tools()[0]
builder = pyocr.builders.TextBuilder()
langs = tool.get_available_languages()
lang = langs[0]

# 定義OCR圖片文字識別函數
def  pic_orc(filepath,filename,resize_num,b):
    """
    :param filepath: 文件路徑
    :param filename:文件名稱
    :return:文字識別
    """
    time1 = time.time()
    im = Image.open(str(filepath) + str(filename))
    # 圖像放大
    im = im.resize((im.width * int(resize_num), im.height * int(resize_num)))
    # 圖像二值化
    imgry = im.convert('L')
    # 對比度增強
    sharpness = ImageEnhance.Contrast(imgry)
    sharp_img = sharpness.enhance(b)
    txt =tool.image_to_string(sharp_img, lang=lang,builder=builder)
    time2 = time.time()
    print('本次圖片識別總共耗時%s s' % (time2 - time1))
    return txt



if __name__ == '__main__':
    filepath='F:/img_spam/test/'
    filename='1.png'
    resize_num = 2
    b = 2.0
    txt=pic_orc(filepath,filename,resize_num,b)
    print(txt)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【python 圖片文字識別】pyocr圖片文字識別

爲什麼要⽤ Foundry

【筆記】動手學深度學習-預備知識

py發送email

MySQL 分庫分表方案，總結太全了。。

Qt/C++音視頻開發71-指定mjpeg/h264格式採集本地攝像頭/存儲文件到mp4/設備推流/採集推流

WPF開源輕便、快速的桌面啓動器

公司來了個新同事，把 DDD 運用得爐火純青！

【深度學習走進tensorflow2.0】TensorFlow binary was not compiled to use: AVX2

【matlab 圓周率計算】matlab 求圓周率的兩種算法實現比較

【深度學習走進tensorflow2.0】TensorFlow 2.0 常用模塊@tf.function

【機器學習非線性迴歸模型】10分鐘瞭解下8種常見的非線性迴歸模型

【深度學習走開tensorflow2.0】TensorFlow 2.0 常用模塊tf.TensorArray

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結