rcnn論文

clipboard

面臨的挑戰:

1、目標檢測窗口生成:

方法一:將檢測任務作爲迴歸問題

方法二:滑動窗

方法三:selective search

2、數據集較少

通過在大的數據集ILSVRC上進行有監督的預訓練

測試模塊的設計:

1、目標建議框的生成:selective search

2、特徵提取:從每個建議區域227x227 提取到4096維特徵。爲了得到統一227x227圖像,採用仿射變換。

3、對於每一個類採用1 vs res svm進行分類。

訓練細節:

1、有監督的預訓練,圖像級別的標籤

2、fine-tune卷積層,將目標分爲21類,iou>0.5 = postive,在mini batch 128 = 32postive +96background

3、分類svm訓練,閾值設置非常重要,直接影響mAP,iou = 0.3。注意訓練svm時候,由於訓練數據比較多,negative數量遠遠大於postive數量,所以採用standard hard negative mining method

錯誤分析:

1、Loc poor location

2、Sim 和相似的類混淆

3、Oth 和不相似的類混淆

4、BG 假陽性

相比於dmp更多的錯誤在於定位誤差,所以下面才用了bounding box的迴歸。

技術關鍵點:

selective search

affine image warping 仿射變換

standard hard negative mini method

如何對bounding box進行迴歸修正

發佈了90 篇原創文章 · 獲贊 31 · 訪問量 9萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章