用tesseract識別名片,無任何訓練
數字,字母識別的準確率比較高,沒有錯誤,規範的漢字識別的還可以,比如名片背面,正面的就錯誤比較多了;
沒有任何訓練,識別的還算可以了;我們主要要的電話和QQ
712 wget https://github.com/tesseract-ocr/tessdata/blob/master/chi_sim.traineddata
713 ls -lth
714 rm chi_sim.traineddata #下載太慢了,還是用瀏覽器下載快,然後上傳過去
715 rz -e
716 ls
717 tesseract test.jpg result -l chi_sim
718 cp chi_sim.traineddata /usr/local/share/tessdata/
719 sudo cp chi_sim.traineddata /usr/local/share/tessdata/
720 tesseract test.jpg result -l chi_sim