南航验证码识别方案

最近挺多人问起南航的验证码怎么识别,https://b2c.csair.com/ita/rest/intl/captcha/challenge?type=ac
在这里插入图片描述
看起来好像挺常规的,不过多刷新几次
在这里插入图片描述
可以看到其实字体变化挺多,而且坑的地方在于,字体相似度挺高,其次【字符边缘粘结】,这种粘接匹配度刚刚好,对于LSTM的特征提取挺不友好的其实,实际图片宽大于200,而一般情况网上的开源验证码识别的代码的backbone基本都是精简的VGG,3-5层CNN堆叠结构,不少使用MCG的朋友用了好几万样本训练许久发现识别率还是0,可以调整传入图片的尺寸,稍加变形更有利于这种图片的特征提取。笔者配置的参数如下:
在这里插入图片描述
还有一点,笔者做了二值预处理,阈值220。
最终朋友测试说识别率大约在94%,速度依旧是2-3ms。

总结:有时候图片训练效果不好可以试试调参大法,不一定要迷恋原始尺寸。

感兴趣的可以加群: 857149419
小编QQ:27009583

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章