論文解讀Face Detection using Deep Learning: An Improved Faster R-CNN Approach

https://arxiv.org/pdf/1701.08289.pdf
FDDB face detection benchmark evaluation

引言:

在物體檢測上,R-CNN十分成功,跟隨這個工作,我們提出一個新的臉部檢測方法,擴展改進Faster R-CNN算法。我們的算法通過結合幾個策略,包括特徵連接,強負面挖掘(hard negative mining)和多尺度訓練等來改進。
最終達到state-of-the-art 的表現

方法:

包含兩個部分:RPN(Region Proposal Network)爲了生成RoIs(同Faster R-CNN);和一個fast RCNN 網絡來區分RoIs是物體(或背景),並調整這些區域的邊界。
這裏寫圖片描述
首先我們用WIDER FACE訓練模型,並生成hard negatives。然後第二步把這些hard negatives送入訓練,然後用FDDB數據集調優。最後我們應用多尺度訓練和特徵連接策略(feature concatenation strategy)。最後一個額外步驟,我們將檢測的邊界框轉換爲橢圓。
下面我們詳細討論這幾個關鍵步驟

特徵連接(feature concatenation)

傳統RoI pooling是在最後一個特徵圖上提取RoI。這種方法不總是最優且可能遺漏一些重要特徵,因爲深層卷積層的特徵輸出有更廣的接受域,導致成爲更特徵粗糙。我們爲了捕獲更好的RoI的細節,我們結合了多聚集層的特徵圖,包括低層與高層。我們合併了多個卷積層的池化結果來生成最後的池化特徵。特別的,低層的卷積層都是經過ROI池化和L2正則化。然後合併,縮放,然後用1x1卷積來匹配最後的channels。結構如圖:

這裏寫圖片描述

Hard Negative Mining

將未能正確分類的樣本標記爲困難樣本,再一次送入模型中。我們把實際值上的IoU小於 0.5 的區域視爲負樣本。(its itersection over union (IoU) over the ground truth region was less than 0.5), 在Hard Negative Mining 中, 我們把這些hard negative困難負樣本添加到RoIs中來微調模型,並把前景和後景的比率調到1:3左右,和我們在第一步裏的比率相同。

多尺度訓練

輸入多尺度圖片訓練,經驗主義說明多尺度訓練讓模型更有魯棒性,提高了在測試集上的表現。

發佈了34 篇原創文章 · 獲贊 18 · 訪問量 5萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章