- 類似於faster rcnn的二階段檢測算法,通過anchor作爲中間元素進行迴歸;不同之處是增加了LSTM單元;
- anchor 固定寬度爲16個像素,高度設定爲10個值;
- IOU的計算,由於anchor指定寬度16,所以對GoundTruth的座標也進行變換,得到寬度爲16的GT。和faster rcnn一樣計算anchor與GT的IOU;
- RPN爲LSTM輸出序列經fc後得到部分;
- proposal直接與網絡的預測值計算損失。proposal不涉及pooling操作。
- loss
- 預測時,對預測框先進行nms得到固定寬度的柵格框
- 合併柵格框——文本線構造算法
參考文獻: