論文筆記Cascade RPN: Delving into High-Quality Region Proposal Network with Adaptive Convolution

1. 論文標題及來源

Cascade RPN: Delving into High-Quality Region Proposal Network with Adaptive Convolution, NIPS, 2019
下載地址:https://arxiv.org/abs/1909.06720

2. 擬解決問題

a. 傳統RPN啓發式定義anchor(在特徵圖每個像素生成anchor,通過乘步長映射到原圖)
b. 傳統RPN未將anchor的特徵對齊(類似於ROI Align解決的問題,池化或者卷積的時候不能整除,會有小數)

3. 解決方法

3.1 算法流程

在這裏插入圖片描述
a. 使用骨幹網絡提取輸入圖片的特徵
b. 在輸入圖片中隨機產生anchors
c. 計算每層級聯中anchor的偏移量
d. 將當前層級聯輸出的預測結果作爲下一層的輸入
e. 重複c和d直到完成級聯
f. 計算目標的得分,使用NMS篩選得到最終的定位框,如下所示
在這裏插入圖片描述

3.2 自適應卷積

提出目的:anchor-free metric(根據距離判斷正負樣本)在第二階段中對正樣本的要求過低,會導致誤判;anchor-based metric(根據IOU判斷正負樣本)在第一階段中無法產生足夠的正樣本,因爲要求過於苛刻

y[p]=oOw[o]x[p+o]y[p] = \sum_{o \in O} w[o]*x[p + o]

該過程類似卷積過程,y表示輸出的特徵圖,p表示輸出特徵圖中每個像素的位置(x, y),w表示權重,x表示輸入特徵圖,O表示偏移域,計算方式如下
O=Octr+OshpO = O_{ctr} + O_{shp}

Octr=(axpx,aypy)O_{ctr} = (\overline a_x - p_x, \overline a_y - p_y)

Oshp{(aw2,ah2),(aw2,0),,(0,ah2),(aw2,ah2)}O_{shp} \in \{(-\frac{\overline a_w}{2}, -\frac{\overline a_h}{2}), (-\frac{\overline a_w}{2}, 0), \dots , (0, \frac{\overline a_h}{2}), (\frac{\overline a_w}{2}, \frac{\overline a_h}{2}) \}

a\overline a表示anchor a在特徵圖上的映射向量,當出現小數時,使用線性插值補齊

具體過程見下圖,藍點表示卷積時對應的位置,淺色(不知道叫啥顏色好)表示原始位置
在這裏插入圖片描述

3.3 RPN迴歸公式

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述

4. 實驗結果

4.1 COCO 2017

在這裏插入圖片描述

4.2 消融實驗

在這裏插入圖片描述
在這裏插入圖片描述

4.3 其它

在這裏插入圖片描述
在這裏插入圖片描述

5. 總結

該算法分析了RPN中存在的問題,然後在級聯RPN使用自適應卷積解決這些問題。不過我感覺他這裏的級聯和迭代RPN看起來區別不大,只是換了些裏面的構件。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章