Focal Loss for Dense Object Detection(ICCV2017)論文簡析

原創

2019-07-09 22:55

目標檢測中存在的問題：

速度和簡易程度上：一階段的detector>兩階段的detector

精準度上：一階段的detector<兩階段的detector

這個問題產生的原因是：

在稠密的detector訓練時，前景背景類間極度不平衡

所以呢

作者通過reshape交叉熵loss，給易分類的樣本更小的權重，來解決這個問題。還提出了RetinaNet

目前的兩階段detector已經達到較高的精度，爲什麼簡單的單階段detector不能又快，精度又高呢。這篇文章就通過解決單階段detector裏最大的障礙-——類間不平衡，提出新的loss,來達到又快，又能達到兩階段detector的精度的效果。

類間不平衡在R-CNN這樣的detector中，都是通過兩階段級聯和啓發式採樣解決的。在第一階段通過候選區域框的方法（選擇性搜索算法，EdgeBoxes、DeepMask、RPN）快速減少候選區域框的個數；在第二階段通過啓發式採樣的方法(如固定的前後景比例，OHEM)保持前後景平衡
相比，單階段detector不許處理很多候選區域框。通常大約100k個。如果用啓發式採樣，可能效果不會很好，可以通過bootstrapping或者hard example mining來改善。
這篇文章提出Focal Loss:帶權重因子的交叉熵loss
這篇文字提出RetinaNet,基於特徵金字塔和anchor-based

經典傳統的目標檢測方法：滑動窗口、VJDetector、Hog、DPMs
兩階段detectors:和最早的選擇性搜索算法差不多，現在的方法第一步生成一組稀疏的候選框，第二步分類。R-CNN，RPN
單階段detectors:OverFeat、SSD、YOLO
類間不平衡：類間不平衡導致1訓練效率低2》》》這裏不會翻譯，求助
魯棒的估計：已經有一些設計loss的工作，它們都是對於outliers(難分類的樣本)小權重。而本文則是給inliers(易分類的樣本)小權重。簡而言之，focal loss在訓練是更注重難樣本

Focal Loss是基於交叉熵loss（Cross Entropy Loss）設計的，這裏以二分類爲例，先介紹CE：

$CE=\left ( p,y \right )=CE\left(p_{t} \right )=-log(p_{t})$

$p_{t}=\left\{\begin{matrix} p,if y=1\\ 1-p,otherwise \end{matrix}\right.$

圖中藍色線，就是交叉熵loss，可以從曲線中觀察到，當Pt較大也就是>=0.5的時候，仍然存在不小的loss。當在很大的易分類樣本上求和時，這不小的Loss可能覆蓋難分類的樣本

3.1Balanced Cross Entropy

一個常見的方法解決類間不平衡是引入權重因子 $\alpha$ in【0,1】對於Class1 ，1- $\alpha$ 對於class-1。 $\alpha$ 可以是類頻率的逆或者是一個超參數。公式如下：

$CE(p_{t})=-\alpha _{t}log(p_{t})$

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.