CNN中的卷積和池化個人理解

原創

2019-07-31 17:38

針對於圖像識別中常用的CNN，其原理中的卷積層和池化層是最讓人不好理解的。在看完各位大佬的解釋後，小弟趁熱打鐵把目前的理解做個簡單的總結。
以下純屬個人理解，如有錯誤，請指正。

卷積：通過探頭（filter）在輸入矩陣中按照一定步長（stride）去無間隙的掃描。

拿圖像處理爲例，出去常見的二維平面，增加了一個深度（depth）的維度，其中深度可以理解爲三維平面。filter的深度必須與輸入樣本是一致的，就像三維中的3個平面，filter就是三位中的對應不同層面的探頭。由於探頭在掃描過程中，矩陣中間的元素被掃描到的概率會更大一些，所以爲了平衡邊緣元素被掃描到的概率，所以增加了一個pad概念，即在整個矩陣外圍增加一圈0，pad=n, 就增加n全0。卷積層在整個卷積神經網絡中可以有多個。最終經過卷積層輸出的結果的深度就是filter的個數。那麼數據結果的尺寸又是多大呢？如下：

通過整個卷積過程，可以將卷積的操作理解爲對輸入樣本的特徵提取和一定程度上的降維。即卷積就是上採樣

池化（Pooling）：池化的過程是一種降維壓縮的過程

在池化探頭下，根據設定的Pooling方式來對掃描的區域進行降維，常用的是Max和Mean，經過探頭掃描後，提取掃描區域中的max或者mean，這是前向反饋。

在反向傳播過程中，Pooling層會將殘差按照Pooling方式將殘差傳入對應的矩陣位置。如果當時選擇的Max，則會將殘差傳入當時Max的矩陣位置；如果是mean，Pooling會將殘差取mean，然後傳入矩陣每一個位置。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

sorted 在python2和3中的區別

文章目錄sorted 在python2和3中的區別 sorted 在python2和3中的區別 python3中取消了cmp參數 python3中的使用方法如下: from functools import cmp_to_key

2020-07-08 12:31:35

monggoDB學習筆記

1、mongo是什麼關鍵詞：分佈式、可擴展、介於關係與非關係數據庫之間、文檔存儲、JSON格式存儲（可對字段建索引，實現關係數據庫的某些功能）、默認監聽端口27017 MongoDB是一個基於分佈式文件存儲的開源數據庫系統。由C++語言

2020-07-08 12:27:44

Shell編程入門（二）

多練習纔會記得牢這裏的題目來自於（個別刪選）知乎：shell編程如果當前用戶是管理員，則使用yum 安裝 vsftpd,如果不是,則提示您非管理員，不可安裝提示用戶輸入用戶名和密碼,腳本自動創建相應的賬戶及配置密碼。

存在即合理_

2020-07-08 11:22:52

在使用Django出現的疑難雜症

不知道會被笑的點讀法 Django的讀法是 [ˈdʒæŋɡo] 中文發音是迪亞戈重點是D 是輕輔音，讀出來的時候有點像是不發音。版本問題 Python3.0在 2020年是不支持 Django 3.0.4版本的。Djan

存在即合理_

2020-07-08 11:22:52

運維入門（一）

專業名詞出包：項目在執行機上運行，打包出結果，再由運維工程師轉交給開發工程師的一項活動。門禁：門禁指的是CICD的門禁，是指必要的時候進行一系列測試，以保證代碼的質量和其功能是否實現。一般由CI集成工具完成搭建與配置。門禁設

存在即合理_

2020-07-08 11:22:52

Shell編程入門（三）

簡單的Shell 命令 ll /usr/bin/java ll命令顯示詳細信息，如果java是一個目錄，顯示目錄中文件的詳細信息，如果java是一個軟連接，顯示軟連接的指向 ll ‘which java’ 顯示命令的詳細信息

存在即合理_

2020-07-08 11:22:52

Android M 新特性

六大特性： App Permission （軟件權限管理）安裝時候不會提醒權限，而是在使用時候由程序請求權限；用戶也可以在設置中對應用進行相關權限控制Chrome Custom Tags (網頁體驗提升) 登陸網站存儲密碼，自動補全資料

Jay白色风车

2020-07-08 10:03:22

學習筆記----伸展樹

最近在看伸展樹，看到了一個不錯的文章，轉載一下便於以後學習轉載地址：http://dongxicheng.org/structure/splay-tree/ 1、概述二叉查找樹（Binary Search Tree，也叫二

2020-07-08 09:04:26

mini2440開發板學習裸機開發——day1 裸機運行LED燈程序

開發背景：系統：ubuntu18.04系統開發板:mini2440 串口連接工具 J-link連接工具工具：secureCRT J-link 本次學習基於韋東山老師的嵌入式linux應用開發手冊書，結合友善之臂給出的官方資料以

2020-07-08 08:59:17

java入門程序100例學習筆記（005遞歸調用）

問題：兩年期整存零取，每月1000元，年利率1.17，問應存多少錢思路：使用遞歸調用實現：問題：局部變量的問題，變量的定義應該放在哪裏總結：遞歸要掌握好代碼下載鏈接：http://download.csdn.net/detai

2020-07-08 06:59:06

pandas數據分析讀書筆記（五）

plt.xlabel()，畫x軸標題 Plt.ylabel()，畫y軸標題 Plt.savefig(‘figpath.png’)，把圖片保存爲文件 S = pd.Series(np.random.randn(10).cumsum())

2020-07-08 06:46:51

Spring+SpringMVC+Mybatis項目中pom.xml模板

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaL

2020-07-08 06:30:02

Redis在Windows系統下安裝成服務

我們知道Redis沒有Windows系統的安裝版。Windows系統下使用Redis，每次都要打開他的redis-server.exe，並保持cmd窗口不關閉，才能正常使用。要是一不小心關掉cmd窗口，那Redis服務也關閉了。其實Re

2020-07-08 06:30:02

CSS的知識（第一小結）

在對CSS3的學習中，對2D轉換和3D轉換的知識點的理解用CSS3中的知識點（CSS3的轉換），我們能夠對元素進行移動、縮放、轉動、拉長或拉伸。關於2D轉換的幾種情況： 1. translate(x,y)

2020-07-08 09:04:38

第17周的小結

俯首向下看，整個世界豐富多彩，周圍充滿溫暖的陽光，又不失清風相伴，輕踏着時光細膩着空氣裏的淡淡花香，靜靜聆聽這世界的善惡美，默默感受每一次邂逅的怦然心動，來去隨風，無聲無息。嘻嘻，可惜這不是我寫的，我沒有這麼好的文采。好了，迴

2020-07-08 09:04:26

24小時熱門文章

最新文章

最新評論文章