OCR 文本方向和語種識別 總結

https://www.researchgate.net/profile/Lluis_Gomez2/publications   Lluis Gomez  介紹,從icdar2013 到 icdar 2015 , 主要做文本方向和語種識別, 這裏邊有他最近的論文,可以看他的論文,跟進他的研究成果。

http://arxiv.org/pdf/1602.07480.pdf   論文:Boosting patch-based scene text script identification with ensembles of conjoined networks

  這邊文章 使用cnn 提取特徵,然後用多個cnn 模型進行ensemble組合,在兩個官方數據庫上都取得了較好的效果。同時作者自己公開了一個數據庫,

 前期處理和陳哥icdar2015 的方法很想, 使用 patch-based 的方法, 先固定同一高度,然後選擇patch, 輸入到cnn 網絡,最後用分類器集成的方法進行集成。

   (1)  

這篇文章對文本語種和方向識別做了一些綜述, 可以通過看他的這篇文章,學習該方向的相關進展。


(2)   學習他設置cnn 層數調參等細節,訓練參數細節作者介紹的比較詳細,可以復現,


(3)  最後多個分類器之間他採用了簡單的投票策略。







發佈了150 篇原創文章 · 獲贊 197 · 訪問量 97萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章