ORT識別Captcha【記錄】

心血來潮, 想識別一下一般論壇裏登錄的驗證碼,類似於這樣的

網上有一個tesseract-ocr庫,是一個OCR 引擎。

此引擎的優點重複下,字母類語言的識別率幾乎可達100%,前提是圖像最好黑白(二值化過地),噪點少地圖,測試時發現每個字符的高度必須在10個像素以上才能識別.
      增強識別率的關鍵是要識別的驗證碼圖片越乾淨越好,爲此準備了六種圖像過濾,用以濾乾淨圖像,有:圖像二值化,銳化,中值濾波,線性灰度變換,轉黑白灰度圖,放大(非平滑縮放).

    一般干擾不太嚴重的驗證碼,如支付寶使用圖像二值化和線性灰度變換就可以做到100%識別,有噪點的才需要中值濾波.

使用這六種過濾的組合應該可以搞定大部分比較弱智的驗證碼。

插播一段:


OCR技術是光學字符識別的縮寫(Optical Character Recognition),是通過掃描等光學輸入方式將各種票據、報刊、書籍、文稿及其它印刷品的文字轉化爲圖像信息,再利用文字識別技術將圖像信息轉化爲可以使用的計算機輸入技術。

 

Ruby gem  rtesseract

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章