TridentNet解讀

檢測領域一直存在一個scale variation問題,大小物體對視野域的需要是不一樣的,deformable cnn的作者daijifeng老師就提到一個說法:最好的視野域就是剛好“覆蓋自己”,不要太大也不要太小。前人有3種途徑

  • 利用RCNN去原圖上扣proposal,強制使得所有物體的視野域就是自己 Revisiting RCNN: On Awakening the Classification Power of Faster RCNN
  • Deformable cnn,可變型卷積不同物體學習不同的視野域 論文中也有可視化的圖 Deformable ConvNets v2
  • Image Pyramid SNIP系列 分三路RPN學習不同尺度的物體SNIP
  • Feature Pyramid FPN系列 能部分解決尺度問題,爲了兼容大小物體,導致大小物體特徵的“表達能力”都不是最強
    在這裏插入圖片描述
    而本文TridentNet也算是分3路學習不同尺度的物體,不過不是將網絡直接分成三路,因爲SNIP這樣的測試時間太慢了
  • 爲了使模型對不同尺寸目標的“表達能力”近似,作者借鑑了SNIP的特徵提取網絡,採用了“scale-aware”的並行結構;
  • 爲了加快模型的推理速度,作者採用了dilated convolution得到不同感受野的特徵圖,從而實現檢測不同尺度目標的目的,取代了SNIP中的特徵金字塔生成不同尺度目標的做法

從下圖發現,不同dilation也即是不同視野域分別適應不同尺度的物體,大視野域對大物體友好,小視野域對小物體友好
在這裏插入圖片描述

在這裏插入圖片描述

效果賊好
在這裏插入圖片描述


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章