CNN中的感受野總結

原創

2018-12-07 23:33

最近面試問到了有關感受野的知識，所以總結了一下：

參考鏈接：CNN中感受野的計算、深度學習中的感受野計算

定義：感受野就是網絡中輸出特徵圖對應輸入圖像的區域。簡單地說，就是特徵圖裏面的一個元素受輸入圖像多大區域像素的影響。

所以根據定義，如果我們只計算某兩個連續層之間的感受野，則可以通過直接畫圖，看輸入圖像多大的範圍對應特徵圖中的一個點來確定兩者之間的感受野。

但是，如果網絡比較深，那麼計算最後的特徵圖和輸入圖像的感受野，則變得異常麻煩。好在有人已經總結了公式，如下：

$F\left ( i,j-1 \right ) = k_j +\left ( F\left ( i,j \right ) -1\right )*s_j$

k_j表示的第j層的kernel_size,s_j表示第j層的stride.這個式子分爲兩部分，一部分是指k_j，即局部感受野，另一部分是stride,可理解爲當前層在每多一個原子，上一層的感受野多增加stride個（在第一個局部感受野的基礎上增加的;

其中，F(i,i)=1；i爲最後一層，0爲輸入層。一般算到F(i,0)。

下面我拿一個例子來算算：

答案如下：

pool3的一個輸出對應pool3的輸入大小爲2*2

對應conv4的輸入爲4*4

對應conv3的輸入爲6*6

對應pool2的輸入爲12*12

對應conv2的輸入爲14*14

對應pool1的輸入爲28*28

對應conv1的輸入爲30*30

所以pool3的感受野大小就是30*30

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

深度學習_目標檢測_FPN論文詳解

FPN的創新點多層特徵特徵融合解決了目標檢測中的多尺度問題，通過簡單的網絡連接改變，在基本不增加原有模型計算量的情況下，大幅度提升小物體（small object）的檢測性能。在物體檢測裏面，有限計算量情況下，網絡的深

2020-07-08 11:57:07

Ubuntu + Python + Opencv3.x開發環境

by hirah border="0" width="330" height="86" src="//music.163.com/outchain/player?type=3&id=2057832642&auto=1&heigh

2020-07-08 11:05:23

cv2.VideoWriter()

cv2.VideoWriter前幾個參數最後一個參數，視頻的幀寬和幀高前幾個參數博客：cv2.VideoWriter() 最後一個參數，視頻的幀寬和幀高這個可能經常容易寫錯或者忘記 outVideo = cv2.VideoW

2020-07-08 10:45:04

yolov4訓練自己的數據集實現安全帽佩戴檢測

昨兒立下來的flag，今天還是要含淚完成的，抓緊時間趕呀！！！本次用yolov4來實現人佩戴安全帽檢測，若未佩戴安全帽則將人臉框出來，若佩戴安全帽，則將安全帽以及人臉框出來，多說無益，直接看效果吧！！！效果還是不錯的，那

mind_programmonkey

2020-07-08 09:29:00

使用PaddleDetection訓練自己的數據集

使用PaddleDetection訓練自己的數據集 https://aistudio.baidu.com/aistudio/projectdetail/441868?shared=1

2020-07-08 08:24:13

零基礎實戰行人重識別ReID項目-基於Milvus的以圖搜圖

目錄第一階段，ReID的基本概念 1.1 ReID定義 1.2 技術難點 1.3 常用數據集 1.4 評價指標 1.5 實現思路 1.6 具體方案第二階段：復現算法 2.1 PCB的骨幹網絡 2.2 PCB的流程 2.3 PCB的細節

2020-07-08 08:24:13

AAAI 2020 收錄的百度騰訊優圖螞蟻金服的論文

會議官網：https://aaai.org/Conferences/AAAI-20/ 關注公衆號code4fun，回覆 “百度28” ，打包下載會議收錄的百度研究院的論文。注：暫缺3篇，已標註，後續更新。百度28篇論文清單，來自

2020-07-08 08:24:13

MTCNN/LPRNet車牌識別細節

文章目錄1.獲取車牌圖片2.MTCNN數據處理2.1 PNet網絡數據預處理2.2 PNet網絡訓練2.3 ONet網絡數據預處理2.4 ONet網絡訓練3. LPRNet數據處理和訓練4. 預測4.1 PNet過程4.2 ONe

不会写作文的李华

2020-07-08 06:19:36

華爲雲杯-粵港澳大灣區強降水臨近預測比賽小結

比賽背景根據近年的雷達回波格點數據共同建立的標準雷達數據集爲基礎劃分了訓練集和測試集，希望參賽者綜合運用計算機視覺、機器學習、深度學習等技術，實現根據過去2個小時內的雷達回波圖像數據預測未來2小時的雷達回波圖像變化，並提交未來

你知道网上冲浪吗

2020-07-08 04:33:29

機器學習中SVM+HOG實現對飲料瓶的識別

#include<opencv.hpp> #include<iostream> #include<highgui/highgui.hpp> #include<ml/ml.hpp> #include<string> #include

计算机爱好者001

2020-07-08 02:49:33

CycleGAN-and-pix2pix 環境搭建|簡記

CycleGAN and pix2pix in PyTorch CycleGAN-and-pix2pix GitHub Linux系統下conda的安裝與使用 pip 源配置 Linux下cuda9.1安裝Pytorch和Torc

2020-07-08 00:28:09

Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation論文解讀

（CVPR 2020｜中科院VIPL實驗室） 1.要解決的問題：基於類別標籤的弱監督語義分割是一個具有挑戰性的問題，類別響應圖（class activation map，簡稱CAM）始終是這一領域的基礎方法。但是由於強監督與弱監督信號之

2020-07-08 00:02:52

曠世x北大公開課 | 深度學習實戰筆記（1）

最近關注到一門28課時的《深度學習實戰》的公開課（B站上有全集資源），覺着1-2天可以對深度學習有一個具體的瞭解，所以就開看了，這一篇是記錄聽課的學習筆記。人工智能主要有以下四部分：語音（speech）視覺（vision

2020-07-07 22:24:06

【MaixPY 教程】用mixly玩轉k210——條形碼、二維碼、AprilTag識別

【MaixPY 教程】用mixly玩轉k210——條形碼、二維碼、AprilTag識別【MaixPy系列教程：】【MaixPy教程】用maixHub訓練模型進行開源硬件識別【MaixPy 教程】用mixly玩轉K210—

2020-07-07 22:04:16

動作識別——action recognition新手入門

定義行爲識別似乎是圖像分類任務到多個幀的擴展，然後聚合來自每幀的預測背景傳統方法，視頻輸入=》特徵提取=》特徵融合=》特徵分類=》分類結果深度學習方法，單流法，雙流法，基於骨架特徵提取，ROI提取表示傳統方法 DT（D

2020-07-07 20:22:22

24小時熱門文章

最新文章

最新評論文章