Focal Loss for Dense Object Detection(ICCV2017)論文簡析

Abstract


目標檢測中存在的問題:

速度和簡易程度上:一階段的detector>兩階段的detector

精準度上:一階段的detector<兩階段的detector

這個問題產生的原因是:

在稠密的detector訓練時,前景背景類間極度不平衡

所以呢

作者通過reshape交叉熵loss,給易分類的樣本更小的權重,來解決這個問題。還提出了RetinaNet

1.Introduction


目前的兩階段detector已經達到較高的精度,爲什麼簡單的單階段detector不能又快,精度又高呢。這篇文章就通過解決單階段detector裏最大的障礙-——類間不平衡,提出新的loss,來達到又快,又能達到兩階段detector的精度的效果。

  • 類間不平衡在R-CNN這樣的detector中,都是通過兩階段級聯和啓發式採樣解決的。在第一階段通過候選區域框的方法(選擇性搜索算法,EdgeBoxes、DeepMask、RPN)快速減少候選區域框的個數;在第二階段通過啓發式採樣的方法(如固定的前後景比例,OHEM)保持前後景平衡
  • 相比,單階段detector不許處理很多候選區域框。通常大約100k個。如果用啓發式採樣,可能效果不會很好,可以通過bootstrapping或者hard example mining來改善。
  • 這篇文章提出Focal Loss:帶權重因子的交叉熵loss
  • 這篇文字提出RetinaNet,基於特徵金字塔和anchor-based

2.Related Work


  • 經典傳統的目標檢測方法:滑動窗口、VJDetector、Hog、DPMs
  • 兩階段detectors:和最早的選擇性搜索算法差不多,現在的方法第一步生成一組稀疏的候選框,第二步分類。R-CNN,RPN
  • 單階段detectors:OverFeat、SSD、YOLO
  • 類間不平衡:類間不平衡導致1訓練效率低2》》》這裏不會翻譯,求助
  • 魯棒的估計:已經有一些設計loss的工作,它們都是對於outliers(難分類的樣本)小權重。而本文則是給inliers(易分類的樣本)小權重。簡而言之,focal loss在訓練是更注重難樣本

3.Focal Loss


 Focal Loss是基於交叉熵loss(Cross Entropy Loss)設計的,這裏以二分類爲例,先介紹CE:

CE=\left ( p,y \right )=CE\left(p_{t} \right )=-log(p_{t})

p_{t}=\left\{\begin{matrix} p,if y=1\\ 1-p,otherwise \end{matrix}\right.

 

圖中藍色線,就是交叉熵loss,可以從曲線中觀察到,當Pt較大也就是>=0.5的時候,仍然存在不小的loss。當在很大的易分類樣本上求和時,這不小的Loss可能覆蓋難分類的樣本

3.1Balanced Cross Entropy

一個常見的方法解決類間不平衡是引入權重因子\alphain【0,1】對於Class1 ,1-\alpha對於class-1。\alpha可以是類頻率的逆或者是一個超參數。公式如下:

CE(p_{t})=-\alpha _{t}log(p_{t})

 3.2Focal loss Definition

 

 

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章