【目標檢測】多尺度檢測:STDN

Paper:Scale-Transferrable Object Detection

論文鏈接:http://openaccess.thecvf.com/content_cvpr_2018/papers/Zhou_Scale-Transferrable_Object_Detection_CVPR_2018_paper.pdf

這是2018年的CVPR目標檢測paper,主要是多尺度問題。

目標檢測的多尺度問題,一直非常重要。最常用的是PFN,但是PFN會增加內存和計算量,這篇文章提出來一個STDN網絡,適合於實時目標檢測。

Introduction

常見的幾種方式:

image


(a)使用單一尺度的feature map做檢測,沒有利用多層信息,現在主流還是多尺度融合。

(b)FPN的思想,將多尺度的feature map進行融合,並且針對不同尺度的分別做predict,充分利用了網絡信息,對小目標的效果提升明顯,但是會增加計算量和內存佔用。

(c)SSD的思想,每一層都各自檢測一遍,然後將檢測結果融合

(d)STDN的結構,相當於將FPN和SSD做了融合。

Model

image

STDN的結構如圖。使用的base network是DenseNet-169,上面的圖展示的是DenseNet-169的最後一個密集塊的幾個層,密集塊中的幾個層的輸出維度一樣大小。

STM模塊由Pooling層和尺度轉換(scale-transfer)層組成使用scale-transfer層,來獲得高分辨率的特徵圖來檢測小目標,使用池化層來獲得接受域大的特徵圖來檢測大目標。這些層可以直接嵌入到基本網絡中,而不需要太多的計算開銷。STM模塊保證了探測器的實時性。

底下六個正方形,最後兩個就是在增大map尺寸,同時壓縮channel。

網絡信息日誌:

image

Scale-transfer layer

image

展示的就是增大map,壓縮channel的示意。

也就是把信息擱到整張圖上去,原本1x1的區域變成了rxr,相當於feature的一個rearrangement

Experiment

VOC 2007 test:

image


COCO:

image

VOC上的速度與精度

image


實驗結果上來看,兼顧速度與精度。速度優勢比較大。

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章