OHEM+fast RCNN的總結和代碼解析

這是CVPR2016的一篇論文,用於目標檢測,本篇博文先介紹這個算法,然後介紹其Caffe代碼。

論文:Training Region-based Object Detectors with Online Hard Example Mining 
論文鏈接:https://arxiv.org/abs/1604.03540

算法概述:

  1. 首先篩選出那些對結果(分類和檢測)影響比較大的樣本,然後將這些篩選得到的樣本在隨機梯度下降中訓練。
  2. 實際的操作是利用兩個ROI網絡,一個用於向前傳播,用於計算損失,另外一個是可以向前和向後傳播,以收集到的hard example作爲輸入,計算損失並且回傳梯度。
  3. 作者將該算法應用在Fast RCNN中,網絡結構還是採用VGG16和VGG_CNN_M_1024,數據集主要採用VOC2007,VOC2012和COCO數據集。 

算法優點:

1、對於數據的類別不平衡問題不需要採用設置正負樣本比例的方式來解決,這種在線選擇方式針對性更強。

2、隨着數據集的增大,算法的提升更加明顯(作者是通過在COCO數據集上做實驗和VOC數據集做對比,因爲前者的數據集更大,而且提升更明顯,所以有這個結論)。

算法的測試結果:在pascal VOC2007上的mAP爲78.9%,在pascal VOC2012上的mAP爲76.3%。注意,這些結果的得到包含了一些小tricks,比如multi-scale test(測試時候採用多尺度輸入),bounding box的不斷迭代迴歸。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章