Fast R-CNN論文解讀

原創

2020-02-20 13:13

Fast R-CNN論文解讀

一、相關知識

首先要了解R-CNN和SPPnets存在的不足之處：
R-CNN:
1、多層結構，比較冗雜。
2、時間和空間開銷較大。
3、目標檢測過程太慢。
SPPnets:
1、和R-CNN一樣依然是多層結構較爲繁瑣。
2、微調算法不能更新卷積層，限制了深層神經網絡的準確性。

二、論文貢獻

提出了Fast R-CNN算法，彌補了R-CNN和SPPnets的不足之處，具有以下幾個優點：
1、相比於R-CNN、SPPnets具有更高的精度和速度。
2、訓練是一步到位，使用了一個多任務loss。
3、訓練可以更新所有神經網絡層。
4、對於特徵捕捉沒有硬盤存儲需求。

三、模型結構

1、RoI 池化層

RoI池化層使用最大池化來把圖片特徵轉化爲有效的RoI區域，使其成爲有一個特定空間範圍的特徵圖。每一個RoI由四個元素來定義（r,c,h,w),以此來確定左上角位置座標（r,c)，以及它的高度和寬度（h,w)。

2、來自預訓練網絡的初始化

作者使用了三個預訓練好的ImageNet網絡，每一個網絡有5個池化層和13個卷積層。經歷了以下三個步驟：
第一、最後一層最大池化層被RoI池化層替換，通過設定H和W來讓其與第一層全連接層相適合。
第二、神經網絡的最後一層全連接層和softmax被兩個兄弟層替換。
第三、神經網絡被修正爲接收兩種數據輸入：一類是圖片，另一類是這些圖片中的RoIs區域。

3、檢測的微調

在Fast R-CNN中，作者提出了一種更有效率的取樣方式。首先取樣N張圖片然後從每張圖片中取出R/N個RoIs區域。對於來自相同圖片的RoIs共享計算和記憶。除了這個，作者還優化了softmax分類器和BB迴歸，而不是訓練一個softmax分類器SVMs和三個分開區域的迴歸。

以下分別對loss、mini-batch sampling strategy、通過RoI的反向傳播、SGD算法進行介紹：

Multi-task loss：
p:每一個種類的概率。
t:BB迴歸偏置,有四個參數（x,y,w,h),確定迴歸框的位置和尺寸。
u:每一個訓練的RoI綁定的真實類別標籤。
v:每一個BB迴歸框目標的真實值。
λ：控制兩個loss的平衡。

Mini-batch sampling：
每一個mini-batch來源於兩張圖片，取mini-batch的大小等於128，這樣每張圖片就有64個RoIs樣本。對於提取出來的這些RoIs,取和真實值的迴歸框重疊超過0.5的作爲類別的基準，其餘的RoIs來自於和真實值有最大IoU的目標區域。這些是背景樣本，令u=0。

Back-propagation through RoI pooling layers：
x(i)表示第i層RoI池化層的輸入,y表示輸出。

SGD hyper-parameters:
對於每一層來說，權重的學習率爲1，偏差的學習率爲2，整體的學習率爲0.001.當在VOC07和VOC12上訓練時，運行了SGD算法30000次mini-batch迭代。

四、實驗設計

數據集上的比較結果：
實驗中使用了三個預訓練好的ImageNet模型，此處記作S/M/L，分別代表小、中、大。
以下爲與多個模型的比較結果：
訓練和測試時間：

對於微調層的確定：

此處作者有兩個發現：
（1）相較於從conv3_1開始學習，從conv2_1開始讓訓練變慢。（12.5 vs 9.5)
（2）從conv1_1開始更新超出了GPU的記憶負荷。

五、設計評估

多任務訓練是否有幫助？
爲了解決這個問題，作者訓練了只含有L（cls)損失函數的基線網絡，並把這個基線分爲了S,M,L三個類別。
尺度不變性：暴力解決還是巧妙解決？
以下是多尺度vs單尺度：

可以看出，單尺度和多尺度在精度上差別並不大，而且多尺度在計算時間上還有很大的開銷。
是否需要更多的訓練數據？
通過擴大數據集的容量，mAP從66.9%提高到了70.0%，mini-batch的迭代次數也從40k增加到了60k.
SVMs是否超過softmax?
作者通過在模型中訓練 hard negative mining ，來看模型對VOV07數據集的識別效果：
提議越多效果越好嗎？

通過圖片看出，mAP先增然後又輕微的下降隨着proposal的不斷增加。圖中的Average Recall（AR）表示目標提議的質量，可以看出AR與mAP並沒有多大的聯繫。

發佈了5 篇原創文章 · 獲贊 2 · 訪問量 144

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

目標檢測經典網絡之Faster RCNN

Faster R-CNN 針對Fast R-CNN的缺陷而提出。由於Fast R-CNN，採用的是Selective Search（SS），測試時的很大一部分時間要耗費在候選區域的提取上。Faster R-CNN正是爲解決這個問題而提出來

2020-07-07 01:30:45

Mask R-CNN tensorflow 訓練自己的數據

Mask R-CNN tensorflow 訓練自己的數據 https://blog.csdn.net/doudou_here/article/details/87855273 labelme https://blog.csdn.ne

2020-07-08 12:33:38

深度學習_目標檢測_FPN論文詳解

FPN的創新點多層特徵特徵融合解決了目標檢測中的多尺度問題，通過簡單的網絡連接改變，在基本不增加原有模型計算量的情況下，大幅度提升小物體（small object）的檢測性能。在物體檢測裏面，有限計算量情況下，網絡的深

2020-07-08 11:57:07

深度學習_目標檢測_“YOLOv5”詳解（持續更新）

YOLOv5可以方便的進行工程化部署： YOLOv5（PyTorch）−>ONNX−>CoreML−>iosYOLOv5（PyTorch） -> ONNX -> CoreML -> iosYOLOv5（PyTorch）−>ONNX

2020-07-08 11:57:07

IOU計算代碼

import numpy as np def compute_iou(box1, box2, standard_coordinates=True): ''' :param box1: [Xmin, Ymin, Xmax

2020-07-08 10:30:45

Faster RCNN圖解

高清圖：faster rcnn流程圖.png

2020-07-08 10:30:45

NMS計算代碼

''' # INPUT：所有預測出的bounding box (bbx)信息（座標和置信度confidence），　IOU閾值（大於該閾值的bbx將被移除） for object in all objects: (1) 獲取當前目

2020-07-08 10:30:45

yolov4訓練自己的數據集實現安全帽佩戴檢測

昨兒立下來的flag，今天還是要含淚完成的，抓緊時間趕呀！！！本次用yolov4來實現人佩戴安全帽檢測，若未佩戴安全帽則將人臉框出來，若佩戴安全帽，則將安全帽以及人臉框出來，多說無益，直接看效果吧！！！效果還是不錯的，那

mind_programmonkey

2020-07-08 09:29:00

YOLOV5目標檢測----上手

YOLOV5目標檢測----上手 2020年4月23日，YOLOV4開源 2020年6月10日，YOLOV5開源這兩個日子，可是把CV類公衆號的運營者忙壞了，各大公衆號都在忙着搶“首發” 當然，YOLOV4是貨真價實的YOLO

西红柿爱吃小番茄

2020-07-08 07:02:00

目標檢測框架——Dtectron2

前言目標檢測的模型還是很多的，要挨個挨個學還是有點喫力（精力旺盛可忽略），所以這裏總結一下當前流行的目標檢測的框架：darknet yolov4，mmdetection2.0，detectron2.0。至於這三個框架怎麼去選擇，

不会写作文的李华

2020-07-08 06:19:37

目標檢測框架——mmdetection2.0

前言目標檢測的模型還是很多的，要挨個挨個學還是有點喫力（精力旺盛可忽略），所以這裏總結一下當前流行的目標檢測的框架：darknet yolov4，mmdetection2.0，detectron2.0。至於這三個框架怎麼去選擇，

不会写作文的李华

2020-07-08 06:19:36

三、訓練自己的yolo3模型

yolo3整體的文件夾構架如下：本文使用VOC格式進行訓練。訓練前將標籤文件(.xml) 放在 VOCdevkit 文件夾下的 VOC2007 文件夾下的 Annotation 中。訓練前將圖片文件放在 VOCdevkit

2020-07-07 15:53:01

在win10下編譯yolov4

最近在研究yolov4在win10下如何進行編譯，不說廢話了，直接記錄一下我研究的過程以及遇到的錯誤和解決方案，希望能夠幫助大家。 0 環境系統：win 10 GPU：GTX 2080Ti CUDA：10.0 cuDNN：7.4.1

2020-07-07 14:48:57

論文閱讀筆記：(YOLO 看一次就夠了) You Only Look Once: Unified, Real-Time Object Detection

尊重原創，轉載請註明：http://blog.csdn.net/tangwei2014 這是繼RCNN，fast-RCNN 和 faster-RCNN之後，rbg（Ross Girshick）大神掛名的又一大作，起了一個很娛樂化的

2020-07-07 08:02:37

吳恩達深度學習筆記：R-CNN 篇

2020-07-07 02:01:59

24小時熱門文章

最新文章

最新評論文章