目標檢測模型二：Fast-R-CNN，ROI池化

原創

2018-09-03 09:31

1. Fast R-CNN

R-CNN需要很多候選區域以提高準確度，但是很多候選區域其實是彼此重疊的，如果我們有2000個候選區域，每一個候選區域都需要獨立的送到CNN中，對於不同的ROI，我們需要提取2000次特徵，效率很低。CNN的特徵圖是以一種密集的方式表徵空間特徵，我們可以直接使用特徵圖來代替原圖來檢測目標。

不同於R-CNN多次對每個圖像提取特徵，Fast R-CNN使用特徵提取器(CNN)先提取整個圖像的特徵，然後將創建候選區域的方法直接應用到特徵圖中。

例如，Fast R-CNN 選擇了 VGG16 中的卷積層 conv5 來生成 ROI，這些關注區域隨後會結合對應的特徵圖以裁剪爲特徵圖塊，並用於目標檢測任務中。我們使用 ROI 池化將特徵圖塊轉換爲固定的大小，並饋送到全連接層進行分類和定位。因爲 Fast-RCNN 不會重複提取特徵，因此它能顯著地減少處理時間。
以下是Fast R-CNN的流程圖：

Fast R-CNN包含了特徵提取器、分類器和邊框迴歸器在內的整個網絡能通過多任務損失函數進行端到端的訓練，這種分類包含了分類損失方法和定位損失方法，大大提升了模型準確度。

ROI池化

Fast R-CNN使用全連接層，我們需要使用池化層將不同大小的ROI轉換爲固定大小的ROI。
假如我們有如下特徵圖，我們想要轉換成預定義的2*2大小的ROI：

首先將ROI與特徵圖重疊：

然後將ROI拆分成目標維度的ROI，因爲我們要求生成2*2的ROI,所以我們考慮將上圖拆分爲4個大小相等或近似的部分。

然後使用max-pooling的方式找到每個區域的最大值，生成2*2的特徵模塊，分佈饋送到分類器和邊框迴歸器中。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

深度學習_目標檢測_FPN論文詳解

FPN的創新點多層特徵特徵融合解決了目標檢測中的多尺度問題，通過簡單的網絡連接改變，在基本不增加原有模型計算量的情況下，大幅度提升小物體（small object）的檢測性能。在物體檢測裏面，有限計算量情況下，網絡的深

2020-07-08 11:57:07

深度學習_目標檢測_“YOLOv5”詳解（持續更新）

YOLOv5可以方便的進行工程化部署： YOLOv5（PyTorch）−>ONNX−>CoreML−>iosYOLOv5（PyTorch） -> ONNX -> CoreML -> iosYOLOv5（PyTorch）−>ONNX

2020-07-08 11:57:07

「機器學習_8」Bag-of-Words

Bag-of-Words 1.文字問題 2. 什麼是Bag-of-Words(具體例子） 3. 侷限性 1.文字問題文本建模的一個問題是它很雜亂，機器學習算法之類的技術更喜歡定義明確的

2020-07-08 11:01:54

迴歸損失函數：L1 Loss, L2 Loss, Smooth L1 Loss

講解的很清楚： https://www.cnblogs.com/wangguchangqing/p/12021638.html

2020-07-08 10:39:04

感知機中的關鍵問題：點到平面的距離，和梯度更新的符號

感知機的原理、以及學習方法，還是比較簡單的，參考： https://www.pkudodo.com/2018/11/18/1-4/ 但其中有2點關鍵，不是特別好理解： 1、關於點到平面的距離：參考：https://www.jian

2020-07-08 10:27:04

變身漫畫道具玩了沒？這樣的 AI 人像特效機器學習服務幫你實現

近期，抖音上一款 “變身漫畫” 的特效刷爆“我的關注”，二次元漫畫樣式的畫風更是讓大家欲罷不能。從明星到路人，從大朋友到小朋友紛紛參與其中，抖音 App 中“變身漫畫”話題頁顯示約有 1851 萬餘人使用該道具。如今，此類視頻 / 圖片

2020-07-14 12:03:51

分類問題中的決策面畫法 (直觀理解plt.contour的用法)

摘要通過分類問題中決策面的繪製過程直觀理解matplotlib中contour的用法，主要包括對 np.meshgrid 和plt.contour的直觀理解。前言分類問題中，我們習慣用2維的dmeo做例子，驗證算法的有效性。

张王李刘赵孙杨

2020-07-08 11:10:55

KNN算法第二章 Pandas & sklearn 機器學習實戰 Machine Learning in action

本專欄計劃藉助Pandas與sklearn重新實現書中的實戰案例。 k-近鄰算法1. KNN算法流程2. KNN改進約會網站的配對效果2.1 數據準備：從文本中解析數據2.2 數據可視化：散點圖2.3 數據處理：歸一化數值2.4

2020-07-08 11:09:44

[R]聚類算法:k-means模組

延伸<[Excel]k-means聚類算法的應用，以評價現有供應商的水平為例。>文章，同時恰巧在圖書館看到一本R語言機器學習書籍，因此正好可進一步瞭解如何用R語言來實現k-means算法和應用，一併將k-means模組建立起來，做為未來參

2020-07-08 10:38:53

python--內置函數

1、python內置函數：類型轉換數學運算常用 int() max() all() range() help() float() min() any() set() format() long() sum() type()

2020-07-08 10:38:40

Mask R-CNN tensorflow 訓練自己的數據

Mask R-CNN tensorflow 訓練自己的數據 https://blog.csdn.net/doudou_here/article/details/87855273 labelme https://blog.csdn.ne

2020-07-08 12:33:38

IOU計算代碼

import numpy as np def compute_iou(box1, box2, standard_coordinates=True): ''' :param box1: [Xmin, Ymin, Xmax

2020-07-08 10:30:45

Faster RCNN圖解

高清圖：faster rcnn流程圖.png

2020-07-08 10:30:45

NMS計算代碼

''' # INPUT：所有預測出的bounding box (bbx)信息（座標和置信度confidence），　IOU閾值（大於該閾值的bbx將被移除） for object in all objects: (1) 獲取當前目

2020-07-08 10:30:45

yolov4訓練自己的數據集實現安全帽佩戴檢測

昨兒立下來的flag，今天還是要含淚完成的，抓緊時間趕呀！！！本次用yolov4來實現人佩戴安全帽檢測，若未佩戴安全帽則將人臉框出來，若佩戴安全帽，則將安全帽以及人臉框出來，多說無益，直接看效果吧！！！效果還是不錯的，那

mind_programmonkey

2020-07-08 09:29:00

24小時熱門文章

最新文章

最新評論文章