https://arxiv.org/pdf/1701.08289.pdf
FDDB face detection benchmark evaluation
引言:
在物體檢測上,R-CNN十分成功,跟隨這個工作,我們提出一個新的臉部檢測方法,擴展改進Faster R-CNN算法。我們的算法通過結合幾個策略,包括特徵連接,強負面挖掘(hard negative mining)和多尺度訓練等來改進。
最終達到state-of-the-art 的表現
方法:
包含兩個部分:RPN(Region Proposal Network)爲了生成RoIs(同Faster R-CNN);和一個fast RCNN 網絡來區分RoIs是物體(或背景),並調整這些區域的邊界。
首先我們用WIDER FACE訓練模型,並生成hard negatives。然後第二步把這些hard negatives送入訓練,然後用FDDB數據集調優。最後我們應用多尺度訓練和特徵連接策略(feature concatenation strategy)。最後一個額外步驟,我們將檢測的邊界框轉換爲橢圓。
下面我們詳細討論這幾個關鍵步驟
特徵連接(feature concatenation)
傳統RoI pooling是在最後一個特徵圖上提取RoI。這種方法不總是最優且可能遺漏一些重要特徵,因爲深層卷積層的特徵輸出有更廣的接受域,導致成爲更特徵粗糙。我們爲了捕獲更好的RoI的細節,我們結合了多聚集層的特徵圖,包括低層與高層。我們合併了多個卷積層的池化結果來生成最後的池化特徵。特別的,低層的卷積層都是經過ROI池化和L2正則化。然後合併,縮放,然後用1x1卷積來匹配最後的channels。結構如圖:
Hard Negative Mining
將未能正確分類的樣本標記爲困難樣本,再一次送入模型中。我們把實際值上的IoU小於
多尺度訓練
輸入多尺度圖片訓練,經驗主義說明多尺度訓練讓模型更有魯棒性,提高了在測試集上的表現。