RefineDet + Dynamic Anchor Feature Selection for Single-Shot Object Detection

Single-Shot Refinement Neural Network for Object Detection+Dynamic Anchor Feature Selection for Single-Shot Object Detection


兩個文章都是關於物體檢測的,第二篇文章在第一篇文章的基礎上進行的。

  • Single-Shot Refinement Neural Network for Object Detection
    作者認爲如果Single-Stage的網絡借鑑Two-Stage網絡中的設計理念,可以進一步提高檢測精度,同時又不失去檢測速度。Two-Stage網絡相對於Single-Stage網絡的效果好主要有以下幾個原因:
    (1)兩階段可以篩選掉一些negative,進而解決類別不平衡問題。
    (2)兩次迴歸邊界框。
    (3)使用兩階段特性來描述對象。
    如果將這種設計思路運用到Single-Stage網絡中,那麼最終的網絡既有Single-Stage的速度,又有Two-Stage的準確度,這也是本文所做的工作。網路設計圖如下:
    在這裏插入圖片描述
    網絡主要由三部分組成:Anchor Refinement Moudle;Transfer Connection Block;Object Detection Moudle

-Anchor Refinement Moudle
ARM模塊類似於Faster RCNN中的RPN模塊,主要用來產生proposal,並對anchor進行初步的篩選和微調。ARM模塊的輸出是anchor的微調回歸向量和前景/背景的概率。這樣設計,通過前景/背景概率就可以對anchor進行篩選,過濾掉一些negative的anchor,從而解決類別不平衡問題。同時還可以對anchor進行粗略的修正。

-Object Detection Moudle
ODM模塊主要接受來自ARM模塊經過調整後的anchor,ODM和ARM模塊有着相同的feature-map-size,將調整過後的anchor輸入到ODM模塊,抽取對應區域的feature map進行分類和迴歸。

-Transfer Connection Block
TCB模塊主要是用來連接ARM和ODM模塊,TCB結構如圖所示:

TCB將ARM中的高層次feature和低層次的feature進行融合,然後輸出爲ODM對應的特徵。
  1. Dynamic Anchor Feature Selection for Single-Shot Object Detection
    本文是在RefineDet的基礎上進行的改進,主要創新點有兩方面:
    (1)ARM調整後的anchor在ODM模塊中會自動選擇特徵區域( Dynamic Feature selection)。
    (2)使用Bidirectional feature fusion(BFF)代替TCB模塊,既將高層特徵融合到底層,也將底層特徵融合到高層。

RefineDet中使用ARM模塊對anchor進行微調,然後將微調後的anchor送到ODM模塊中進一步的預測。但是,對比ODM模塊和SSD就會發現。ODM中輸入的anchor尺寸不在是固定的,而是經過調整之後的。也就是說,在SSD中anchor的W,H是一個標量,但在ODM卻成了一個變量。更爲重要的是,anchor成爲一個變量後,ODM中的輸入並沒有發生變化,依舊是原始未經過調整anchor對應的feature-map(我是這麼理解的),這種不對等性限制了網絡的性能。

所以文章借鑑了ROIAlign策略,使得調整後的anchor可以自動的選擇feature points

對於RefineDet中的TCB模塊之進行了高層特徵到底層的融合,而在本文中,還進行了底層特徵到高層的融合,主要使用的是BFF(Bidirectional feature fusion)模塊,網絡整體結構如下:
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章