pytesseract 使用簡介

#!/usr/bin/env python
# -*- coding:utf-8 -*-


import pytesseract

from captcha.image import ImageCaptcha

import  random

imageCaptcha = ImageCaptcha()

chars = []

# A ~ Z
for i in range(65,91):
    chars.append(chr(i))

# a ~ z
for i in range(97,123):
    chars.append(chr(i))

for i in range(10):
    chars.append(str(i))

# 列表
code = random.choices(chars, k=4)

# 將列表轉換爲str
code = ''.join(code)

image = imageCaptcha.generate_image(code)

image = image.convert('L')

data = image.load()
# print(data[150,25])

w,h = image.size

for i in range(w):
    for j in range(h):
        print(data[i, j])
        if data[i,j] >180:
            # 255表示純白
            data[i,j] = 255

        else:
            # 0表示純黑
            data[i,j] = 0

image.show()

# 之所以沒有識別,tesseract訓練時候,給的數據方方正正
# 識別準確率提高,修改,captcha源碼,將生成的圖片,普通圖片
str = pytesseract.image_to_string(image)

print(str)

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章