Group Sampling for Scale Invariant Face Detection閱讀筆記

Movitation

作者發現在訓練過程中存在兩個問題

  • 正負樣本不均衡(OHEM,focal Loss等都是解決這個問題)
  • 樣本的尺度不均衡問題,在基於iou的匹配策略下,小尺度的樣本更難匹配到合適的anchor。

     插一句,個人感覺小目標在這種基於anchor的檢測方法中性能較差的本質原因在於有效訓練的樣本過少,最終計算loss時正樣本選擇的是和anchor匹配上的樣本,大目標很容易和尺度類似的anchor達到很高的iou,而小目標即使anchor尺寸類似,由於由於anchor密度的原因,仍然更難匹配到合適的anchor,因此解決方法應該分爲三點:1,增大訓練樣本中的小樣本數量,更多的輸入自然就有更高的概率獲得有效樣本(方法如訓練樣本過採樣,DAS生成小目標樣本);2,增大小尺度anchor的密度(如S3FD),anchor密度增加,可以匹配的有效樣本自然更多。 3,降低小尺度目標匹配的iou閾值

方法

    將參與訓練的樣本按照尺度分爲不同的組,計算loss是每組等比例採樣(以前是所有正樣本都使用的)。ps,這裏的樣本指的就是anchor在訓練過程中的實例化,更直白點就是和target匹配上的anchor,不是輸入的圖片。這樣做的結果是各尺度的樣本在訓練過程中是公平的,相當於輸入的訓練樣本各尺度均衡一樣,避免被某種尺度主導loss。

 

貢獻

 

   先解釋一下,灰色框中16/16,32/16 et..第一個數字代表anchor的尺度,第二個數字代表anchor的step(在原圖上的像素距離,一般,傳統的我們都按照feature map的尺寸放置anchor,基本上feature map一個點對應一個anchor,因此anchor的step一般和feature的step相等)。

  這篇文章最大的貢獻就是發現了FPN網絡有效的原因是應爲不同scale的anchor的step不同,並非是因爲使用了多層特徵,b和c的性能類似。c和d都使用了相同層的特徵,相同scale的anchor,但是anchor的step不同,由此d中的大scale的anchor數量遠多於c,從而大目標的匹配的有效anchor更多,檢測器更偏向於大目標。c通過改變不同scale的anchor的step,使得其分佈類似於fpn,最終取得和fpn類似的結果。

     最終給我們的啓示,訓練過程中各scale的有效樣本(匹配到正樣本的anchor數量)數量應該均衡,這樣訓練出來的檢測器才更好。

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章