論文筆記:Rich feature hierarchies for accurate object detection and semantic segmentation(R-CNN)

論文筆記:RCNN

這是CVPR 2014的一篇經典論文,首次提出R-CNN檢測網絡,雖然速度很慢,但是在那個時間點已經算是一個開創性的工作了。

簡介

這篇文章提出了一個二階段的方法進行目標檢測。第一步通過一個卷積神經網絡生成2000個區域提案。第二步通過神經網絡提取特徵向量;第三步通過SVM將特徵向量分類。最後通過非極大值抑制NMS刪除IOU大於0閾值的框。
在這裏插入圖片描述

具體實現

區域提案

通過快速模式的選擇性搜索獲得2000個提案、

特徵提取

對於獲得的提案,在將區域尺寸變換到227*227(神經網絡輸入尺寸)之前,先將提案的區域擴充以增加環境信息,並確保尺寸變換之後,環境信息有p像素寬(p=16)。
神經網絡對每一個區域提取出一個4096維度的特徵向量。

分類

使用一個權重係數矩陣爲4096×N4096 \times N尺寸的SVM將特徵向量分成N類。

訓練

CNN用ILSVRC 2012數據進行預訓練,使用VOC進行fine-tune。訓練分類器時,考慮到樣本過多,採用難例挖掘(hard negative mining method)選擇樣本訓練SVM。

性能

一張圖片13s(GPU),mAP比之前最好的算法提高了30%

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章