CTPN理解

CTPN pipline
  • 類似於faster rcnn的二階段檢測算法,通過anchor作爲中間元素進行迴歸;不同之處是增加了LSTM單元;
  • anchor 固定寬度爲16個像素,高度設定爲10個值;
ctpn中的anchor 圖片來自這裏
  • IOU的計算,由於anchor指定寬度16,所以對GoundTruth的座標也進行變換,得到寬度爲16的GT。和faster rcnn一樣計算anchor與GT的IOU;
  • RPN爲LSTM輸出序列經fc後得到部分;
CTPN中的RPN,圖片來自這裏
  • proposal直接與網絡的預測值計算損失。proposal不涉及pooling操作。
  • loss 

  • 預測時,對預測框先進行nms得到固定寬度的柵格框
  • 合併柵格框——文本線構造算法
圖片來自這裏

參考文獻:

  1. 場景文字檢測—CTPN原理與實現
  2. 深度學習-TextDetection

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章