論文筆記:RCNN
這是CVPR 2014的一篇經典論文,首次提出R-CNN檢測網絡,雖然速度很慢,但是在那個時間點已經算是一個開創性的工作了。
簡介
這篇文章提出了一個二階段的方法進行目標檢測。第一步通過一個卷積神經網絡生成2000個區域提案。第二步通過神經網絡提取特徵向量;第三步通過SVM將特徵向量分類。最後通過非極大值抑制NMS刪除IOU大於0閾值的框。
具體實現
區域提案
通過快速模式的選擇性搜索獲得2000個提案、
特徵提取
對於獲得的提案,在將區域尺寸變換到227*227(神經網絡輸入尺寸)之前,先將提案的區域擴充以增加環境信息,並確保尺寸變換之後,環境信息有p像素寬(p=16)。
神經網絡對每一個區域提取出一個4096維度的特徵向量。
分類
使用一個權重係數矩陣爲尺寸的SVM將特徵向量分成N類。
訓練
CNN用ILSVRC 2012數據進行預訓練,使用VOC進行fine-tune。訓練分類器時,考慮到樣本過多,採用難例挖掘(hard negative mining method)選擇樣本訓練SVM。
性能
一張圖片13s(GPU),mAP比之前最好的算法提高了30%