ctpn論文閱讀與代碼

代碼地址: https://github.com/zonghaofan/ctpn_torch

1.通用的目標檢測是封閉的,而文字是封閉且連續 

2. 構造一系列寬度相等的小文本,迴歸中心y座標和高度

3. 對於邊界迴歸x座標,在進一次修正

4.整個模型就是backbone提取特徵,將每個像素點的相鄰3*3像素拉成行向量,利用空間信息,在進入lstm提取時序信息進行分類與迴歸.

5.文本構建算法將每個相鄰豎直文本框進行合併

6.一些中間過程

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章