日更(六十一)-前端-python輔助寫前端頁面-實踐 瞎扯 不好使的地方: 總結:

瞎扯

按着昨天的想法,今天上午研究了一上午.
集成了tesseract-ocr,環境搞了半天

然後呢,發現不太好使.

哪不好使呢.

不好使的地方:

1.安裝的時候手賤,windows環境選了當前用戶可用.搞了半天.

最後還是,發現,不要亂改,默認就好,
然後配環境變量,各種找原因.不好使.
一直報NotFount.
最後,卸載,默認安裝,啥也不改.就成了
然後對於識別庫的路徑,引用好像也有問題.不過這個好解決.代碼動態配置就行

2.識別準確度不高.

發現在不訓練,不加其他圖片處理方法的情況下,提高成功率的辦法.
1.圖片中的字,顯示要大,字之間的間距大一點
2.圖片中的文字.粗一點
3.圖片中的文字最好是宋體,正楷這種.比較常見標準的字體
4.不要有邊框

總結:

玩了半天,總結起來,就是.要想真正用起來,必須花很多時間去訓練字體庫.大工程一個.
所以思來想去,還是放棄了.
按我的需求,其實我完全可以用百度免費的識別就完了,一天3萬次好像,完全夠用.

其實真要這麼簡單弄出來,個人用感覺都浪費了..哈哈

不過換了種方式,既然達不到那麼智能,只能就退而求次.
爭取只複製操作一次,代碼寫的差不多了.就差改進優化了.哈哈

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章