代碼地址: https://github.com/zonghaofan/ctpn_torch
1.通用的目標檢測是封閉的,而文字是封閉且連續
2. 構造一系列寬度相等的小文本,迴歸中心y座標和高度
3. 對於邊界迴歸x座標,在進一次修正
4.整個模型就是backbone提取特徵,將每個像素點的相鄰3*3像素拉成行向量,利用空間信息,在進入lstm提取時序信息進行分類與迴歸.
5.文本構建算法將每個相鄰豎直文本框進行合併
6.一些中間過程
代碼地址: https://github.com/zonghaofan/ctpn_torch
1.通用的目標檢測是封閉的,而文字是封閉且連續
2. 構造一系列寬度相等的小文本,迴歸中心y座標和高度
3. 對於邊界迴歸x座標,在進一次修正
4.整個模型就是backbone提取特徵,將每個像素點的相鄰3*3像素拉成行向量,利用空間信息,在進入lstm提取時序信息進行分類與迴歸.
5.文本構建算法將每個相鄰豎直文本框進行合併
6.一些中間過程