面臨的挑戰:
1、目標檢測窗口生成:
方法一:將檢測任務作爲迴歸問題
方法二:滑動窗
方法三:selective search
2、數據集較少
通過在大的數據集ILSVRC上進行有監督的預訓練
測試模塊的設計:
1、目標建議框的生成:selective search
2、特徵提取:從每個建議區域227x227 提取到4096維特徵。爲了得到統一227x227圖像,採用仿射變換。
3、對於每一個類採用1 vs res svm進行分類。
訓練細節:
1、有監督的預訓練,圖像級別的標籤
2、fine-tune卷積層,將目標分爲21類,iou>0.5 = postive,在mini batch 128 = 32postive +96background
3、分類svm訓練,閾值設置非常重要,直接影響mAP,iou = 0.3。注意訓練svm時候,由於訓練數據比較多,negative數量遠遠大於postive數量,所以採用standard hard negative mining method
錯誤分析:
1、Loc poor location
2、Sim 和相似的類混淆
3、Oth 和不相似的類混淆
4、BG 假陽性
相比於dmp更多的錯誤在於定位誤差,所以下面才用了bounding box的迴歸。
技術關鍵點:
selective search
affine image warping 仿射變換
standard hard negative mini method
如何對bounding box進行迴歸修正