論文:Focal Loss for Dense Object Detection
引言:
目前最好的物體檢測都是基於兩個平臺(two stage),和推薦驅動的機制(proposal-driven mechnism),如R-CNN。近期的集合爲一個平臺(one stage)的工作有YOLO和SSD,他們比前者更快
我們提出了一個新的損失函數用於類的區分(class imbalance),這個損失函數是一個動態縮放的交叉熵Loss(cross entropy loss),當正確分類的可信度提升時,縮放因子會衰退至0。
(我們提出的Focal Loss 就是正常的交叉熵Loss加上一個
直觀上,縮放椅子可以自動縮小簡單樣本的貢獻的參數,從而可以更快的關注困難樣本。實驗顯示我們提出的Focal Loss可以訓練出更高的準確性的(one stage detector),其表現出了啓發式取樣和困難樣本挖掘的效果。
我們提出了一個使用Focal Loss的網絡:取名叫RetinaNet,效果很好
Focal Loss :
cross entropy是這樣的:
其中
爲了標註的方便,我們設
我們嘗試引進一個權重因子
容易區分的樣本組成loss的主要部分並決定着梯度,然而
我們爲cross entropy添加一個調節因子
當一個樣本被分類錯誤時,
在實驗中我們也使用了
有
RetinaNet:
Feature Pyramid Network Backbone
金字塔的每一層用來檢測不同的尺度
從圖中可以看出左邊是ResNet,中間爲提取出feature map(加號爲UpSampling後相加),然後用兩個子網絡相連,輸出類別和邊框。
實驗結果
實驗比較:
設
設
Focal Loss和OHEM相比,提高