開源|如何用Caffe深度學習框架實現A-Fast-RCNN

2017-04-13 11:33

　　全球人工智能

文章來源：arxiv、Github 編譯：馬卓奇

　　論文摘要：A-Fast-RCNN模型通過用對抗網絡生成具有遮擋和變形的樣本，並用其訓練檢測網絡，從而使得網絡能夠對樣本的遮擋和變形問題更加的魯棒。

　　如何學習一個具有變形和遮擋不變形的目標檢測器？目前的方法是使用數據驅動的方法來收集大規模的數據集，然後其中會含有不同條件下的目標樣本。人們希望最終的分類器可以使用這些樣例來學習得到不變性。但是有可能在數據庫中看到所有的遮擋樣例嗎？作者認爲，與類別一樣，遮擋和目標變形也遵循“長尾理論”。有的遮擋和變形樣例很少見，甚至於幾乎不會出現，但是我們需要學習一個可以對這些現象不敏感的模型。在這篇文章中，作者提出了一個替代方法。作者提出學習得到一個對抗式網絡，可以生成具有遮擋和變形情況的樣例。對抗網絡的目標是生成讓目標檢測器難以分類的樣例。在該算法框架下，原始的檢測器和對抗式網絡都是聯合學習的。實驗結果表明，與Fast-RCNN框架相比，我們的算法在VOC07數據庫上的（mAP）有2.3%的提高，在VOC2012目標檢測挑戰數據庫上平均識別精度(mAP)有2.6%的提高。我們也公佈了這篇文章的代碼。

　　網絡結構

ASDN網絡結構以及與Fast RCNN的結合方法

　　ASDN網絡採用使用RoI池化層提取的圖像塊特徵作爲輸入。ASDN網絡產生一個遮擋/丟棄掩模（occlusion/dropout mask），在下一步用於丟棄特徵值，並且傳遞給Fast-RCNN的分類塔

　　代碼實現：

　　這是基於Caffe版本的A-Fast-RCNN。我們最開始是用torch實現的，但是Caffe復現的版本更簡單，更快，使用起來也更方便。

　　我們也發佈了用對抗式空間丟棄網絡（Adversarial SpatialDropout Network）來訓練A-Fast-RCNN的代碼。

　　聲明：

　　該版本實現基於OHEM的代碼復現，而它也是依次基於Faster R-CNN的Python代碼和Fast R-CNN的代碼實現的。如果使用相應部分的模型或代碼，請引用他們的論文。

　　OHEM代碼地址：https://github.com/abhi2610/ohem

　　Faster R-CNN代碼地址：https://github.com/rbgirshick/py-faster-rcnn

　　Fast R-CNN代碼地址：https://github.com/rbgirshick/fast-rcnn

　　運行數據效果：

　　| Approach | training data | test data | mAP

　　| Fast R-CNN (FRCN) | VOC 07 trainval | VOC 07 test | 67.6

　　| FRCN with adversary | VOC 07 trainval | VOC 07 test | 70.8

　　注：該結果基於VGG16網絡

　　安裝地址：

　　請根據安裝說明進行準確安裝，並且下載VOC數據庫以及Faster R-CNN Python代碼。

　　下載地址：https://github.com/rbgirshick/py-faster-rcnn

　　Github的使用方法運行代碼

　　./train.sh

　　包含三個階段的訓練：

　　1 訓練標準的Fast-RCNN，進行10000次迭代，可以在這裏下載該階段的作者的模型和訓練日誌。

　　模型：https://dl.dropboxusercontent.com/u/334666754/CVPR2017_AFRCNN/fast_rcnn_std_iter_10000.caffemodel

　　日誌：https://dl.dropboxusercontent.com/u/334666754/CVPR2017_AFRCNN/fast_rcnn_std.txt.2017-04-08_16-53-59

　　./experiments/s/fast_rcnn_std.sh [GPU_ID] VGG16 pascal_voc

　　2 對抗式網絡的預訓練階段，可以在這裏下載該階段的作者的模型和訓練日誌。

　　模型：https://dl.dropboxusercontent.com/u/334666754/CVPR2017_AFRCNN/fast_rcnn_adv_pretrain_iter_25000.caffemodel

　　日誌：https://dl.dropboxusercontent.com/u/334666754/CVPR2017_AFRCNN/fast_rcnn_adv_pretrain.txt.2017-04-08_19-39-49

　　./experiments/s/fast_rcnn_adv_pretrain.sh [GPU_ID] VGG16 pascal_voc

　　複製上述兩個模型的權重，用於初始化聯合模型

　　./copy_model.h

　　3 檢測器和對抗式網絡的聯合訓練，可以在這裏下載該階段的作者的模型和訓練日誌。

　　模型：https://dl.dropboxusercontent.com/u/334666754/CVPR2017_AFRCNN/fast_rcnn_adv_iter_40000.caffemodel

　　日誌：https://dl.dropboxusercontent.com/u/334666754/CVPR2017_AFRCNN/fast_rcnn_adv.txt.2017-04-09_22-09-57

　　./experiments/s/fast_rcnn_adv.sh [GPU_ID] VGG16 pascal_voc