【A-faster rcnn源碼相關】及訓練日誌

開源|如何用Caffe深度學習框架實現A-Fast-RCNN

  全球人工智能

文章來源:arxiv、Github 編譯:馬卓奇

文章投稿:[email protected]

  論文摘要:A-Fast-RCNN模型通過用對抗網絡生成具有遮擋和變形的樣本,並用其訓練檢測網絡,從而使得網絡能夠對樣本的遮擋和變形問題更加的魯棒。

  如何學習一個具有變形和遮擋不變形的目標檢測器?目前的方法是使用數據驅動的方法來收集大規模的數據集,然後其中會含有不同條件下的目標樣本。人們希望最終的分類器可以使用這些樣例來學習得到不變性。但是有可能在數據庫中看到所有的遮擋樣例嗎?作者認爲,與類別一樣,遮擋和目標變形也遵循“長尾理論”。有的遮擋和變形樣例很少見,甚至於幾乎不會出現,但是我們需要學習一個可以對這些現象不敏感的模型。在這篇文章中,作者提出了一個替代方法。作者提出學習得到一個對抗式網絡,可以生成具有遮擋和變形情況的樣例。對抗網絡的目標是生成讓目標檢測器難以分類的樣例。在該算法框架下,原始的檢測器和對抗式網絡都是聯合學習的。實驗結果表明,與Fast-RCNN框架相比,我們的算法在VOC07數據庫上的(mAP)有2.3%的提高,在VOC2012目標檢測挑戰數據庫上平均識別精度(mAP)有2.6%的提高。我們也公佈了這篇文章的代碼。

  網絡結構

  

ASDN網絡結構以及與Fast RCNN的結合方法

  ASDN網絡採用使用RoI池化層提取的圖像塊特徵作爲輸入。ASDN網絡產生一個遮擋/丟棄掩模(occlusion/dropout mask),在下一步用於丟棄特徵值,並且傳遞給Fast-RCNN的分類塔

  代碼實現:

  這是基於Caffe版本的A-Fast-RCNN。我們最開始是用torch實現的,但是Caffe復現的版本更簡單,更快,使用起來也更方便。

  我們也發佈了用對抗式空間丟棄網絡(Adversarial SpatialDropout Network)來訓練A-Fast-RCNN的代碼。

  聲明:

  該版本實現基於OHEM的代碼復現,而它也是依次基於Faster R-CNN的Python代碼和Fast R-CNN的代碼實現的。如果使用相應部分的模型或代碼,請引用他們的論文。

  OHEM代碼地址:https://github.com/abhi2610/ohem

  Faster R-CNN代碼地址:https://github.com/rbgirshick/py-faster-rcnn

  Fast R-CNN代碼地址:https://github.com/rbgirshick/fast-rcnn

  運行數據效果:

  | Approach | training data | test data | mAP

  | Fast R-CNN (FRCN) | VOC 07 trainval | VOC 07 test | 67.6

  | FRCN with adversary | VOC 07 trainval | VOC 07 test | 70.8

  注:該結果基於VGG16網絡

  安裝地址:

  請根據安裝說明進行準確安裝,並且下載VOC數據庫以及Faster R-CNN Python代碼。

  下載地址:https://github.com/rbgirshick/py-faster-rcnn

  Github的使用方法運行代碼

  ./train.sh

  包含三個階段的訓練:

  1 訓練標準的Fast-RCNN,進行10000次迭代,可以在這裏下載該階段的作者的模型和訓練日誌。

  模型:https://dl.dropboxusercontent.com/u/334666754/CVPR2017_AFRCNN/fast_rcnn_std_iter_10000.caffemodel

  日誌:https://dl.dropboxusercontent.com/u/334666754/CVPR2017_AFRCNN/fast_rcnn_std.txt.2017-04-08_16-53-59

  ./experiments/s/fast_rcnn_std.sh [GPU_ID] VGG16 pascal_voc

  2 對抗式網絡的預訓練階段,可以在這裏下載該階段的作者的模型和訓練日誌。

  模型:https://dl.dropboxusercontent.com/u/334666754/CVPR2017_AFRCNN/fast_rcnn_adv_pretrain_iter_25000.caffemodel

  日誌:https://dl.dropboxusercontent.com/u/334666754/CVPR2017_AFRCNN/fast_rcnn_adv_pretrain.txt.2017-04-08_19-39-49

  ./experiments/s/fast_rcnn_adv_pretrain.sh [GPU_ID] VGG16 pascal_voc

  複製上述兩個模型的權重,用於初始化聯合模型

  ./copy_model.h

  3 檢測器和對抗式網絡的聯合訓練,可以在這裏下載該階段的作者的模型和訓練日誌。

  模型:https://dl.dropboxusercontent.com/u/334666754/CVPR2017_AFRCNN/fast_rcnn_adv_iter_40000.caffemodel

  日誌:https://dl.dropboxusercontent.com/u/334666754/CVPR2017_AFRCNN/fast_rcnn_adv.txt.2017-04-09_22-09-57

  ./experiments/s/fast_rcnn_adv.sh [GPU_ID] VGG16 pascal_voc

  GitHub資源:https://github.com/xiaolonw/adversarial-frcnn

  論文地址:https://arxiv.org/pdf/1704.03414.pdf

  AIJob社是《全球人工智能》旗下專門爲AI開發工程師免費服務的求職平臺。我們將竭盡全力幫助每一個ai工程師對接自己喜歡的企業,推薦給你喜歡的直接領導,幫你談一個最好的薪資待遇。

  微信諮詢:aihr007簡歷投遞:[email protected]企業合作:[email protected]

  全球人工智能》招聘5名兼職翻譯:圖像技術、語音技術、自然語言、機器學習、數據挖掘等專業技術領域,工作內容及待遇請添加工作人員微信:C691993。

  熱門文章推薦

  重磅|讀博不易!約1/3博士生面臨或者潛伏有精神問題

  重磅|申通快遞分揀機器人效率驚人,70%工人直接下崗

  最新|教育部公佈2016年度440名“長江學者”入選名單:人工智能專家約佔10%

  重磅|DeepMind開源DL框架Sonnet:快速構建神經網絡模塊

  重磅|Google推出聯合學習:實現數百萬無集中訓練數據的協同機器學習

  重磅|Google最新AI芯片TPU比最先進的FPGA/GPU快15-30倍!每年可省100億美元!重磅|全球AI報告:看看谷歌|蘋果|Facebook等十幾家巨頭都收購了哪些牛逼的AI公司?

  重磅|4月2日BAT三巨頭CEO齊聚深圳:要麼擁抱“人工智能”,要麼被淘汰!

  重磅|海軍發佈2017年31個公開裝備預研創新項目指南,人工智能技術成重點招聘|東莞理工大學用最高2200萬的待遇招募全球ai人才
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章