我們在抓取抓取數據的時候有些網站需要驗證碼才能 查看,比如火車購票網站 等等:
遇到驗證碼讓我們的小程序很是頭痛, 我也是遇到了這個問題 所以在網上百度了很多, 在各位前輩的文章中 看到google的tessnet2.dll 很不錯 而且數字的正確率基本是100% 當然google維護的肯定不會差,讓我在項目中毅然的使用了這個dll。 當然後期我的項目問題也都出來了
我使用的項目框架是framework4.5 , 每次運行都會報
未加載文件程序集“tessnet2_64”或它的某一個依賴項。試圖加載格式不正確的程序。
在我多次測試才發現, tessnet2.dll 不支持framework4.5, 後期我把項目將爲了4.0 都沒在報錯
程序的步驟
1.將Tessnet2.dll 添加到vs bin目錄,和添加.net程序集一樣。http://files.cnblogs.com/zhuxiangyu/tessnet2_32.rar 點擊鏈接下載Tessnet2.dll, 同時Tessnet2是支持多國語的。語言包下載鏈接:http://code.google.com/p/tesseract-ocr/downloads/list
2.用Tessnet2進行識別
先得到圖片, 在進行識別
使用的是wcf 我使用的是tessnet2_32.dll
下面是我自己測試使用的一個wcf小程序 ,爲了能夠明確不在走那個多彎路 有個小程序也是不錯的