【論文筆記】:Cascade RetinaNet

&Title

在這裏插入圖片描述

&Summary:

Motivation
作者認爲RetinaNet天真的直接將相同設置的多級串聯在一起是沒有多大收穫,主要是類別的置信度和座標之間的錯誤聯繫,以及不同Stage之間的FeatureMap的聯繫發生變化。因此,提出Cascade RetinaNet。感覺就得是採用Cascade R-CNN的方法應用在Retina Net 上,再加了點自己的FCM網絡。

Contributions

  • 探討了特徵不一致問題,針對級聯單階段目標檢測提出了2個設計規則:改進分類置信度和定位表現的一致性,以及保持不同階段的特徵一致性。
  • 爲了提高分類置信度的可靠性,在級聯中逐漸增加 IoU 閾值。另外提出了FCM來環節不同階段中的特徵不一致問題。
  • Cas-RetinaNet 的表現很穩定,在 RetinaNet 基礎上實現了性能提升。

&Problem Statement

在這篇論文中,作者發現單純地往 RetinaNet 中添加與原始設定一樣的級聯階段是無益的。原因主要有2個:

  • 分類置信度和定位表現的不一致性
  • 不同階段中的特徵不一致性

在 RetinaNet 中,如果 IoU 大於某個閾值(如0.5),該預測邊框就被認爲是 positive。這也就是說,不管實際的 IoU 是0.55還是0.95,要分類的目標是一樣的。所以分類置信度就沒法反映定位的精度,如 IoU-Net 提到的。作者發現,在訓練過程中以級聯的方式,逐步提高後續階段 IoU 的閾值,有助於解決不一致的問題,因爲分類目標與實際 IoU 逐漸趨向一致。

&Method:

作者同樣用實驗說明在不同Stage時,IOU與置信度設置之間的關係:
在這裏插入圖片描述

又說明了,原anchor box在修正後,與真實ground truth 之間的位置關係,來解釋不同stage之間的Feature map 的不相關性。
在這裏插入圖片描述
因此,引入FCM網絡 ,從而構建了Cascade RetinaNet
在這裏插入圖片描述
爲了解決特徵不一致性,本文提出了一個簡單而有效的特徵一致性模塊(FCM),使特徵可以適應改良後的新位置。特別地,該方法可以預測特徵圖上每一位置的偏移量,並通過一個簡單的 deformable convolution 層爲後續階段生成優化後的特徵圖。通過級聯的方式,檢測器的 IoU 會逐漸上升,檢測結果逐步得到優化。FCM網絡的方法:
在這裏插入圖片描述
x i 是feature map.

Loss:
和常規的一樣,對不同stage的置信度和位置的迴歸。
在這裏插入圖片描述
在這裏插入圖片描述
加入了λ,α默認設爲1.

&Notes

不一致的原因:
在大多數的目標檢測器中,非極大抑制(NMS)都是去除重複邊框的重要手段。它以迭代的方式運行。在每個迭代中,選取分類置信度最高的邊框,然後通過一個IoU 閾值來抑制其相鄰邊框。分類置信度與定位準確度之間的不一致可能導致以下情形,在NMS過程中準確定位的邊框被沒那麼準確的邊框抑制。

級聯分類和迴歸:
將多個階段級聯起來是一個非常簡單的想法,意圖取得更準確的置信度和定位精度。有些工作已經嘗試了在早期階段使用類似級聯的方式來排斥容易樣本,然後迭代地進行邊框迴歸。但是,傳統方法(尤其是單階段方法)忽視了不同級聯階段中的特徵一致性,因爲它們中的大多數都是通過全卷積的方式從原始位置上提取特徵。雙階段方法利用 RoI-Pooling 或 RoI-Align 提取的特徵來生成預測結果。這些操作降低了不同階段中對不齊的情況,因爲特徵和邊框中心的相關程度沒有很強。而在單階段方法中,滑動窗方式將邊框特徵和邊框中心對齊。下一階段中改良後的邊框與上一階段提取的特徵相關聯,這就限制了模型檢測的性能。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章