Convolution arithmetic 卷積算法
文章、動圖源地址:https://github.com/vdumoulin/conv_arithmetic
深度學習中使用的卷積算法的知識總結。
本教程的代碼和/或圖像可以免費用於非商業用途
- [1] Vincent Dumoulin, Francesco Visin - A guide to convolution arithmetic
for deep learning
(BibTeX)
Convolution animations 卷積Gif
N.B.: 藍色的圖是輸入,綠色的圖是輸出。
不補零(No padding) | 任意補零(Arbitrary padding) | 半補零(Half padding)) | 全補零(Full padding) |
無步長(no strides) | 無步長(no strides) | 無步長(no strides) | 無步長(no strides) |
不補零(No padding) | 有補零(Padding)Padding | 有補零(Padding)Padding | |
有步長(strides) | 有步長(strides) | 有步長(奇步)(strides(odd)) |
Transposed convolution animations 轉置卷積Gif,也叫做Deconvolution
N.B.: 藍色的圖是輸入,綠色的圖是輸出,與上面卷積一一對應。
No padding, no strides, transposed | Arbitrary padding, no strides, transposed | Half padding, no strides, transposed | Full padding, no strides, transposed |
No padding, strides, transposed | Padding, strides, transposed | Padding, strides, transposed (odd) |
Dilated convolution animations 擴張卷積Gif
擴張卷積與普通的卷積相比,除了卷積核的大小以外,還有一個擴張率(dilation rate)參數,主要用來表示擴張的大小。擴張卷積與普通卷積的相同點在於,卷積核的大小是一樣的,在神經網絡中即參數數量不變,區別在於擴張卷積具有更大的感受野。感受野是卷積核在圖像上看到的大小,例如3×33×3卷積核的感受野大小爲9(如下Gif所示)。參考
N.B.: 藍色的圖是輸入,綠色的圖是輸出。
No padding, no stride, dilation |