OHEM+fast RCNN的總結和代碼解析

原創

2019-02-28 21:37

這是CVPR2016的一篇論文，用於目標檢測，本篇博文先介紹這個算法，然後介紹其Caffe代碼。

論文：Training Region-based Object Detectors with Online Hard Example Mining
論文鏈接：https://arxiv.org/abs/1604.03540

算法概述：

首先篩選出那些對結果（分類和檢測）影響比較大的樣本，然後將這些篩選得到的樣本在隨機梯度下降中訓練。
實際的操作是利用兩個ROI網絡，一個用於向前傳播，用於計算損失，另外一個是可以向前和向後傳播，以收集到的hard example作爲輸入，計算損失並且回傳梯度。
作者將該算法應用在Fast RCNN中，網絡結構還是採用VGG16和VGG_CNN_M_1024，數據集主要採用VOC2007，VOC2012和COCO數據集。

算法的測試結果：在pascal VOC2007上的mAP爲78.9%，在pascal VOC2012上的mAP爲76.3%。注意，這些結果的得到包含了一些小tricks，比如multi-scale test（測試時候採用多尺度輸入），bounding box的不斷迭代迴歸。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.