目標檢測(CVPR2017):Feature Pyramid Networks

論文: Feature Pyramid Networks for Object Detection

會議:CVPR2017

目標:識別不同尺度的物體,獲取語義信息與定位信息均比較好的特徵

基礎知識:DCNN中低層特徵中具有較好的定位信息,深層特徵中具有較好的語義信息

各種金字塔網絡結構:

(a)使用圖像金字塔構建特徵金字塔網絡:每個圖像尺度上的特徵都是獨立計算的,速度緩慢。

(b)最近的檢測系統選擇只使用單一尺度特徵進行更快的檢測

(c)使用ConvNet計算金字塔結構

(d)本文提出的金字塔結構,包括自底向上、自頂向下、橫向連接三部分,特徵映射用藍色輪廓表示,較粗的輪廓表示語義上較強的特徵。

特徵金字塔結構:

自下而上的路徑:

  • 實質爲一個下采樣卷積神經網絡的前饋計算,常用ResNet,步長爲2
  • stage: 在網絡結構中,通常有許多層產生相同size的feature map,定義這些層位於相同的網絡階段,定義爲一個stage.
  • 選擇每一個stage的最後一個卷積層的激活層輸出輸出搭建橫向連接

自頂向下的路徑:

  • 對最後一個具有高語義信息的stage的輸出進行上採樣(2X)
  • 與自下向上的features中具有相同尺寸的map進行融合

橫向路徑:

  • 對於兩個路徑具有相同尺寸的features進行融合,
  • 自下向上的feature map通過1X1的Conv減小維度
  • 自頂向下的feature map通過上採樣(2X)
  • 融合使用element-wise 相加,最後通過一個3X3的Conv減輕上採樣的混疊效應

特徵金字塔作用:

  • 自頂向下的路徑傳遞了較好的語義信息
  • 自下向上的路徑傳遞了較好的定位信息
  • 通過橫向連接融合在一起則可以獲取既具有較好的定位信息又具有較好的語義信息的特徵。
  • 不同層輸出可以得到對不同尺度的敏感的特徵,識別不同尺度的物體

應用:在以前的目標檢測方法中加入FPN作爲特徵檢測模塊,提高檢測結果。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章