https://www.researchgate.net/profile/Lluis_Gomez2/publications Lluis Gomez 介紹,從icdar2013 到 icdar 2015 , 主要做文本方向和語種識別, 這裏邊有他最近的論文,可以看他的論文,跟進他的研究成果。
http://arxiv.org/pdf/1602.07480.pdf 論文:Boosting patch-based scene text script identification with ensembles of conjoined networks
這邊文章 使用cnn 提取特徵,然後用多個cnn 模型進行ensemble組合,在兩個官方數據庫上都取得了較好的效果。同時作者自己公開了一個數據庫,
前期處理和陳哥icdar2015 的方法很想, 使用 patch-based 的方法, 先固定同一高度,然後選擇patch, 輸入到cnn 網絡,最後用分類器集成的方法進行集成。
(1)
這篇文章對文本語種和方向識別做了一些綜述, 可以通過看他的這篇文章,學習該方向的相關進展。
(2) 學習他設置cnn 層數調參等細節,訓練參數細節作者介紹的比較詳細,可以復現,
(3) 最後多個分類器之間他採用了簡單的投票策略。