又是一個用Faster R-CNN框架做人臉檢測的,公開測試集指標又高了。T_T
文章鏈接 《Face R-CNN》http://cn.arxiv.org/abs/1706.01061
大體的框架保持不變:
主要改進點:
(1) Center loss
對於最後的二分類,在softmax的基礎上增加了center loss。爲了使得center loss均衡,一個mini batch中正負樣本比例限制爲1:1.
(2) Online Hard Example Mining (OHEM)
每次從正負樣本中各選出loss最大的N個樣本加入下次訓練。
(3) Multi-Scale Training
爲了弱化尺度影響(或者更好地檢測小目標),訓練階段圖片會經過不同尺度縮放。
FDDB上效果如下:
思考
(1) 這裏的center loss應當不難訓練;
(2)很多優化技巧都可以提高人臉檢測(神經網絡)的效果,還比如knowledge distilling(親測有用)。
(3)關於樣本比例的事情,其他地方大多采用正:負=1:3。 講真,這個比例有時候還是挺影響訓練的。特別是做閾值判定的時候。