計算機視覺-卷積基本要素及實例

原創

2020-06-18 22:21

前言

本文將介紹 padding，卷積步長，池化層等概念。

1.基本概念

1.1. padding

綜合兩個缺點，第一個缺點是每次做卷積操作，你的圖像就會縮小，從 6×6 縮小到 4×4，你可能做了幾次之後，你的圖像就會變得很小了，可能會縮小到只有 1×1 的大小。圖像在每次識別邊緣或其他特徵時都縮小。第二個不利因素是那些在角落或者邊緣區域的像素點在輸出中採用較少，意味着丟掉了圖像邊緣位置的許多信息。所以引入了padding概念，簡單來說就是在矩陣外加邊。

爲了解決這些問題，你可以在卷積操作之前填充這幅圖像。在這個案例中，你可以沿着圖像邊緣再填充一層像素。如果你這樣操作了，那麼 6×6 的圖像就被你填充成了一個 8×8 的圖像。如果你用 3×3 的圖像對這個 8×8 的圖像卷積，你得到的輸出就不是 4×4 的，而是 6×6的圖像，你就得到了一個尺寸和原始圖像 6×6 的圖像。習慣上，你可以用 0 去填充，如果𝑞是填充的數量，在這個案例中，𝑞 = 1，因爲我們在周圍都填充了一個像素點，輸出也就變成了(𝑜 + 2𝑞 − 𝑔 + 1) × (𝑜 + 2𝑞 − 𝑔 + 1)，所以就變成了(6 + 2 × 1 − 3 + 1) × (6 + 2 × 1 −3 + 1) = 6 × 6，和輸入的圖像一樣大。這個塗綠的像素點（左邊矩陣）影響了輸出中的這些格子（右邊矩陣）。這樣一來，丟失信息或者更準確來說角落或圖像邊緣的信息發揮的作用較小的這一缺點就被削弱了。

三種填充方式,第一種是 Valid

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

在Kaggle上免費使用GPU

Intro Kaggle提供免費訪問內核中的NVidia K80 GPU。該基準測試表明，在深度學習模型的訓練過程中，爲您的內核啓用GPU可實現12.5倍的加速。這個內核是用GPU運行的。我將運行時間與在CPU上訓練相同模型內核的運

2020-07-08 09:08:45

深度學習(1) 關於圖像卷積和卷積神經網絡（CNN)

最近由於項目組需要，需要看一篇文獻“Deep Learning from Temporal Coherence in Video”。本人也聽過一些關於深度學習，CNN方面的報告，但是其實一直都是似懂非懂，完全不瞭解他們口中

2020-07-07 23:19:57

深度學習論文: A Compact Convolutional Neural Network for Surface Defect Inspection及其PyTorch實現

A Compact Convolutional Neural Network for Surface Defect Inspection PDF:https://www.mdpi.com/1424-8220/20/7/1974/x

2020-07-07 17:00:20

深度學習論文: Pyramidal Convolution: Rethinking CNN for Visual Recognition及其PyTorch實現

深度學習論文: Pyramidal Convolution: Rethinking Convolutional Neural Networks for Visual Recognition及其PyTorch實現 Pyramidal

2020-07-07 17:00:17

Stanford-CS231n-assignment1-KNN及Jupyter Notebook配置

一. 配置我使用的是Anaconda帶的Jupyter Notebook，先在http://cs231n.github.io/assignments2019/assignment1/下載assignment1的.zip文件後可以將其解

不跑步就等肥

2020-07-07 15:12:35

Stanford-CS231n-assignment2-FullyConnectedNets

文章目錄1. layers.py2. fc_net.py3. Solver4. optim.py 1. layers.py from builtins import range import numpy as np def a

不跑步就等肥

2020-07-07 15:12:35

【記錄】爲什麼在CNN的Batch Norm中對C個channel進行歸一化

下面是cs231n-assignment2中的Spatial Batch Norm的介紹中對於此處空間歸一化的解釋，爲什麼對shape爲NCHW的圖像數據進行Batch Norm時需要計算NHW維度的mean和var If th

不跑步就等肥

2020-07-07 15:12:31

Kaggle手寫數字識別（Digit Recognizer）記錄

競賽地址 https://www.kaggle.com/c/digit-recognizer 苦於學了cs231n和pytorch之後沒有東西拿來練手，就去kaggle上找了一個入門競賽，MNIST手寫數字識別，這個比賽把MN

不跑步就等肥

2020-07-07 15:12:31

Stanford-CS231n-assignment2-BatchNormalization

文章目錄1- layers.py2- layer_utils.py加入四個求解batch/layer norm的函數3- fc_net.py的完善4- Batchnorm for deep networks訓練結果4.1- bat

不跑步就等肥

2020-07-07 15:12:31

Stanford-CS231n-assignment1-two_layer_net附中文註釋

先記錄一個很好用的畫神經網絡圖的網站：http://alexlenail.me/NN-SVG/index.html 然後因爲對神經網絡的幾個層的名字到底應該標註在哪有點疑惑，現在看了幾段代碼才弄清楚，所以標註在圖上記錄一下，如下圖（激活函

不跑步就等肥

2020-07-07 15:12:31

AlexNet中Local Response Normalization（局部響應歸一化）個人理解

文章目錄1. 公式介紹2. 代碼實現3. cs231n的cifar10數據集測試3.1 簡化AlexNet測試（無LRN）3.2 帶LRN的AlexNet測試3.3 不嚴謹結論 1. 公式介紹首先論文中已經有了公式的介紹，但是剛

不跑步就等肥

2020-07-07 15:12:31

Pytorch搭建神經網絡基本步驟（文末附pytorch實現AlexNet）

文章參考: http://pytorch123.com/SecondSection/neural_networks/ cs231n assignment2 - http://cs231n.github.io/assignment

不跑步就等肥

2020-07-07 15:12:31

博客目錄——TensorFlow學習筆記

更新時間：2019-07-09 這一系列博客是TensorFlow編程知識及源碼閱讀後整理，陸續更新~ TensorFlow學習筆記(一）：變量作用域 TensorFlow學習筆記(二）：常用方法——激活函數 TensorFl

2020-07-07 01:30:56

目標檢測(object detection)系列（十三）CenterNet：no Anchor，no NMS

目標檢測系列：目標檢測(object detection)系列（一） R-CNN：CNN目標檢測的開山之作目標檢測(object detection)系列（二） SPP-Net：讓卷積計算可以共享目標檢測(object d

2020-07-06 20:45:02

卷積神經網絡.基礎知識

本文是根據吳恩達大仙^_^的卷積神經網絡課程總結的筆記注：在數學上，卷積操作一般之前都會存在一個對filter做翻轉的操作，但是我們在深度學習上的卷積並沒有對filter做翻轉，深度學習上所說的卷積操作實際上應該叫交叉相關，但是大部分深

2020-07-07 08:54:24

24小時熱門文章

最新文章

最新評論文章