南航驗證碼識別方案

最近挺多人問起南航的驗證碼怎麼識別,https://b2c.csair.com/ita/rest/intl/captcha/challenge?type=ac
在這裏插入圖片描述
看起來好像挺常規的,不過多刷新幾次
在這裏插入圖片描述
可以看到其實字體變化挺多,而且坑的地方在於,字體相似度挺高,其次【字符邊緣粘結】,這種粘接匹配度剛剛好,對於LSTM的特徵提取挺不友好的其實,實際圖片寬大於200,而一般情況網上的開源驗證碼識別的代碼的backbone基本都是精簡的VGG,3-5層CNN堆疊結構,不少使用MCG的朋友用了好幾萬樣本訓練許久發現識別率還是0,可以調整傳入圖片的尺寸,稍加變形更有利於這種圖片的特徵提取。筆者配置的參數如下:
在這裏插入圖片描述
還有一點,筆者做了二值預處理,閾值220。
最終朋友測試說識別率大約在94%,速度依舊是2-3ms。

總結:有時候圖片訓練效果不好可以試試調參大法,不一定要迷戀原始尺寸。

感興趣的可以加羣: 857149419
小編QQ:27009583

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章