論文解讀Face Detection using Deep Learning: An Improved Faster R-CNN Approach

原創

2020-02-22 08:39

https://arxiv.org/pdf/1701.08289.pdf
FDDB face detection benchmark evaluation

引言：

在物體檢測上，R-CNN十分成功，跟隨這個工作，我們提出一個新的臉部檢測方法，擴展改進Faster R-CNN算法。我們的算法通過結合幾個策略，包括特徵連接，強負面挖掘（hard negative mining）和多尺度訓練等來改進。
最終達到state-of-the-art 的表現

方法：

包含兩個部分：RPN（Region Proposal Network）爲了生成RoIs（同Faster R-CNN）；和一個fast RCNN 網絡來區分RoIs是物體（或背景），並調整這些區域的邊界。

首先我們用WIDER FACE訓練模型，並生成hard negatives。然後第二步把這些hard negatives送入訓練，然後用FDDB數據集調優。最後我們應用多尺度訓練和特徵連接策略（feature concatenation strategy）。最後一個額外步驟，我們將檢測的邊界框轉換爲橢圓。
下面我們詳細討論這幾個關鍵步驟

特徵連接（feature concatenation）

傳統RoI pooling是在最後一個特徵圖上提取RoI。這種方法不總是最優且可能遺漏一些重要特徵，因爲深層卷積層的特徵輸出有更廣的接受域，導致成爲更特徵粗糙。我們爲了捕獲更好的RoI的細節，我們結合了多聚集層的特徵圖，包括低層與高層。我們合併了多個卷積層的池化結果來生成最後的池化特徵。特別的，低層的卷積層都是經過ROI池化和L2正則化。然後合併，縮放，然後用1x1卷積來匹配最後的channels。結構如圖：

Hard Negative Mining

將未能正確分類的樣本標記爲困難樣本，再一次送入模型中。我們把實際值上的IoU小於 0.5 的區域視爲負樣本。（its itersection over union (IoU) over the ground truth region was less than 0.5），在Hard Negative Mining 中，我們把這些hard negative困難負樣本添加到RoIs中來微調模型，並把前景和後景的比率調到1：3左右，和我們在第一步裏的比率相同。

多尺度訓練

輸入多尺度圖片訓練，經驗主義說明多尺度訓練讓模型更有魯棒性，提高了在測試集上的表現。

全意

發佈了34 篇原創文章 · 獲贊 18 · 訪問量 5萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

論文解讀Face Detection using Deep Learning: An Improved Faster R-CNN Approach

引言：

方法：

特徵連接（feature concatenation）

Hard Negative Mining

多尺度訓練

C語言--右移左移

12款高效開源Wiki系統推薦，打造團隊知識管理利器

一個開源且全面的C#算法實戰教程

dotnet 基於 DirectML 控制檯運行 Phi-3 模型

自定義MyBatis插件

一款.NET開源、功能強大、跨平臺的繪圖庫 - OxyPlot

常用的 Git 指令

sm4加密工具類

論文Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks

Python爬蟲走代理

windows下python3安裝opencv

記一次編寫python爬蟲遇到的問題

python調試方法

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結