在OCR中,特別是爲了提高驗證碼識別率,對會圖片進行預處理。
一般的流程是:
- 轉成灰度圖,或者對特定圖取其中一個通道,
- 高斯濾波去噪
- 進行閾值二值化處理
- 二值圖去除噪點
- OCR識別(傳統機器學習算法,基於CNN的深度學習算法)
如下寫了兩個非高斯降噪方法,一個是針對灰度圖,一個是針對二值圖的。
一、灰度圖非高斯降噪
處理一張1920*1080的圖片0.107s(CPU=i5-8300H)
#%%cython --compile-args=/openmp --link-args=/openmp
import numpy as np
cimport numpy as np
cimport cython
from cython.parallel import parallel, prange
@cython