Abstract
目標檢測中存在的問題:
速度和簡易程度上:一階段的detector>兩階段的detector
精準度上:一階段的detector<兩階段的detector
這個問題產生的原因是:
在稠密的detector訓練時,前景背景類間極度不平衡
所以呢
作者通過reshape交叉熵loss,給易分類的樣本更小的權重,來解決這個問題。還提出了RetinaNet
1.Introduction
目前的兩階段detector已經達到較高的精度,爲什麼簡單的單階段detector不能又快,精度又高呢。這篇文章就通過解決單階段detector裏最大的障礙-——類間不平衡,提出新的loss,來達到又快,又能達到兩階段detector的精度的效果。
- 類間不平衡在R-CNN這樣的detector中,都是通過兩階段級聯和啓發式採樣解決的。在第一階段通過候選區域框的方法(選擇性搜索算法,EdgeBoxes、DeepMask、RPN)快速減少候選區域框的個數;在第二階段通過啓發式採樣的方法(如固定的前後景比例,OHEM)保持前後景平衡
- 相比,單階段detector不許處理很多候選區域框。通常大約100k個。如果用啓發式採樣,可能效果不會很好,可以通過bootstrapping或者hard example mining來改善。
- 這篇文章提出Focal Loss:帶權重因子的交叉熵loss
- 這篇文字提出RetinaNet,基於特徵金字塔和anchor-based
2.Related Work
- 經典傳統的目標檢測方法:滑動窗口、VJDetector、Hog、DPMs
- 兩階段detectors:和最早的選擇性搜索算法差不多,現在的方法第一步生成一組稀疏的候選框,第二步分類。R-CNN,RPN
- 單階段detectors:OverFeat、SSD、YOLO
- 類間不平衡:類間不平衡導致1訓練效率低2》》》這裏不會翻譯,求助
- 魯棒的估計:已經有一些設計loss的工作,它們都是對於outliers(難分類的樣本)小權重。而本文則是給inliers(易分類的樣本)小權重。簡而言之,focal loss在訓練是更注重難樣本
3.Focal Loss
Focal Loss是基於交叉熵loss(Cross Entropy Loss)設計的,這裏以二分類爲例,先介紹CE:
圖中藍色線,就是交叉熵loss,可以從曲線中觀察到,當Pt較大也就是>=0.5的時候,仍然存在不小的loss。當在很大的易分類樣本上求和時,這不小的Loss可能覆蓋難分類的樣本
3.1Balanced Cross Entropy
一個常見的方法解決類間不平衡是引入權重因子in【0,1】對於Class1 ,1-對於class-1。可以是類頻率的逆或者是一個超參數。公式如下:
3.2Focal loss Definition