本文中關於卷積和反捲積內容主要參考論文《A guide to convolution arithmetic for deep learning》¹

文章目錄

卷積

一個2D卷積的示意圖如下(在實際CNN中,我們更常使用3D卷積,其卷積核是3D的):

有填充(zero paddind)	無填充(no padding)

各種形式的卷積算法

因爲在各個通道上的卷積是獨立的,因此在這裏我們就二維單通道卷積,討論各種參數下卷積.爲方便討論,做出如下假設:

輸入是正方形的( $i_1 = i_2 = i$ )
卷積核是正方形的.( $k_1=k_2=k$ )
兩個維度上的卷積步長相等( $s_1 = s_2 = s$ )
兩個維度上的填充層數相同( $p_1 = p_2 = p$ )

下面分別討論卷積參數 $i$ , $k$ , $p$ , $s$ 不同造成的卷積結果的不同²:


No padding, no strides	Arbitrary padding, no strides	Half padding, no strides	Full padding, no strides

No padding, strides	Padding, strides	Padding, strides (odd)

無填充,單位步長(no zero padding, unit strides)卷積

在 $i$ , $k$ 取值任意, $s=1$ , $p=0$ 的情況下:

$o = (i-k)+1$

有填充,單位步長(zero padding, unit strides)卷積

在 $i$ , $k$ , $p$ 取值任意, $s=1$ 的情況下:
$o = (i-k)+2p+1$

根據 $p$ 的取值,有以下兩種特殊的padding::

half (same) padding

half (same) padding下,輸入與輸出的尺寸相同.

在 $k$ 爲奇數( $k=2n+1, n \in \mathbb{N}$ ), $s=1$ , $p= \lfloor k/2 \rfloor = n$ 的情況下:
$o = i + 2 \lfloor k/2 \rfloor − (k − 1) = i + 2n − 2n = i$
full padding

full padding下,輸入的每個像素都參與了同樣次數的卷積

在 $i$ 和 $k$ 取值任意, $p=k-1$ 且 $s=1$ 的情況下:

$o = i + 2(k − 1) − (k − 1) = i + (k − 1)$

無填充,非單位步長(no zero padding, non-unit strides)卷積

在非單位步長下,有可能最後一次卷積並沒有接觸到輸入的末尾.這導致了一些像素沒能被卷積到,因此在計算輸出形狀時有向下取整( $\lfloor \rfloor$ )運算

在 $i$ 和 $k$ 取值任意, $p=k-1$ 且 $s=1$ 的情況下:

$o = \left\lfloor \frac{i-k}{s} \right\rfloor + 1$

有填充,非單位步長(zero padding, non-unit strides)卷積

這是卷積運算的最一般形式,下面兩個示意圖分別展示最後一次卷積接觸到和未接觸到輸入的末尾的情況:

在 $i$ , $k$ , $p$ 和 $s$ 取值任意的情況下:

$o = \left\lfloor \frac{i+2p-k}{s} \right\rfloor + 1$

反捲積(transposed convolution, deconvolution)

反捲積(transposed convolution, deconvolution)與卷積正相反³,可用於將卷積結果在尺寸上放大,實現上採樣(upsampling).

反捲積的數學證明

要理解反捲積,首先卷積是如何實現的,卷積在數學上實際是通過矩陣乘法實現的,對於下述卷積,我們將其表示成矩陣運算的形式:

先分別將輸入 $input$ 和輸出 $output$ 分別展開爲列向量 $X$ 和 $Y$ :
$\begin{aligned} X &= [x^1 x^2 x^3 x^4 x^5 x^6 x^7 x^8 x^9 x^{10} x^{11} x^{12} x^{13} x^{14} x^{15} x^{16}]^T \\ Y &= [y^1 y^2 y^3 y^4]^T \end{aligned}$
構造矩陣 $C$
$C = \begin{bmatrix} w_{0,0} & w_{0,1} & w_{0,2} & 0 & w_{1,0} & w_{1,1} & w_{1,2} & 0 & w_{2,0} & w_{2,1} & w_{2,2} & 0 & 0 & 0 & 0 & 0 \\ 0 & w_{0,0} & w_{0,1} & w_{0,2} & 0 & w_{1,0} & w_{1,1} & w_{1,2} & 0 & w_{2,0} & w_{2,1} & w_{2,2} & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & w_{0,0} & w_{0,1} & w_{0,2} & 0 & w_{1,0} & w_{1,1} & w_{1,2} & 0 & w_{2,0} & w_{2,1} & w_{2,2} & 0 \\ 0 & 0 & 0 & 0 & 0 & w_{0,0} & w_{0,1} & w_{0,2} & 0 & w_{1,0} & w_{1,1} & w_{1,2} & 0 & w_{2,0} & w_{2,1} & w_{2,2} \end{bmatrix}$
則卷積運算可被表示爲
$Y = C X$
卷積運算的反向傳播計算公式爲
$\frac{\partial{J}}{\partial{X}} = \frac{\partial{J}}{\partial{Y}} C^T$

因此反捲積運算可表示爲
$X = (C^T C)^{-1} C^T Y$

使用卷積實現反捲積

卷積和反捲積在數學上都是用矩陣運算實現的,因此,每個反捲積運算都可以用對應的卷積運算來表示,下面分析各種反捲積運算的卷積形式.


No padding, no strides, transposed	Arbitrary padding, no strides, transposed	Half padding, no strides, transposed	Full padding, no strides, transposed

No padding, strides, transposed	Padding, strides, transposed	Padding, strides, transposed (odd)

無填充,單位步長(no zero padding, unit strides)卷積的反捲積

	示意圖
卷積
反捲積

$i$ 和 $k$ 取值任意, $s=1$ , $p=0$ 的卷積所對應的反捲積參數爲 $k'=k$ , $s'=s$ , $p'=k-1$

$o' = i' + (k-1)$

可以用fully padding卷積來實現no padding卷積的反捲積.

有填充,單位步長(zero padding, unit strides)卷積的反捲積

	示意圖
卷積
反捲積

$i$ , $k$ , $p$ 取值任意, $s=1$ 的卷積所對應的反捲積參數爲 $k’=k$ , $s'=s$ , $p'=k-p-1$
$o' = i' + (k − 1) − 2p$

兩種特殊padding所對應的反捲積如下:

half(same) padding卷積的反捲積

示意圖

卷積

反捲積

$k$ 爲奇數( $k=2n+1, n \in \mathbb{N}$ ), $s=1$ , $p= \lfloor k/2 \rfloor = n$ 的卷積所對應的反捲積參數爲 $k'=k$ , $s'=s$ , $p'=p$
$o' = i' + (k − 1) - 2 \lfloor k/2 \rfloor = i + 2n − 2n = i$

可以用same padding來實現same padding卷積的反捲積.
full padding卷積的反捲積

示意圖

卷積

反捲積

$k$ 取值任意, $s = 1$ , $p = k−1$ 的卷積所對應的反捲積參數爲 $k'=k$ , $s'=s$ , $p'=0$
$o' = i' + (k − 1) - 2p= i' -(k-1)$

可以用no padding來實現fully padding卷積的反捲積.

無填充,非單位步長(no zero padding, non-unit strides)卷積的反捲積

直觀來看,對於非單位步長的卷積,其反捲積的步長應爲分數,這也解釋了爲什麼反捲積又被稱爲分數步長卷積.我們實現分數步長的手段是在輸入 $input'$ 的每一行和列之間插入對應數量的空行列,並將反捲積的卷積步長 $s'$ 設爲 $1$ ,這樣就實現了分數步長卷積.

	示意圖
卷積
反捲積

$k$ , $s$ 取值任意, $p =0$ 的且 $i-k$ 爲 $s$ 的整數倍的卷積所對應的反捲積參數爲 $k'=k$ , $s'=1$ , $p'=k-1$ , $i'$ 尺寸爲原輸入每行每列之插入 $s-1$ 個空行列.
$o' = s(i' − 1) + k$

有填充,非單位步長(no zero padding, non-unit strides)卷積的反捲積

在這裏,根據 $i + 2p − k$ 是否能夠整除 $s$ 做出討論:

$i + 2p − k$ 能夠整除 $s$

示意圖

卷積

反捲積

$k$ , $s$ , $p$ 取值任意,且 $i+2p-k$ 爲 $s$ 的整數倍的卷積所對應的反捲積參數爲 $k'=k$ , $s'=1$ , $p'=k-p-1$ , $i'$ 尺寸爲原輸入每行每列間插入 $s-1$ 個空行列.

$o' = s(i' − 1) + k - 2p$
$i + 2p − k$ 不能整除 $s$

示意圖

卷積

反捲積

$k$ , $s$ , $p$ 取值任意,且 $i+2p-k$ 模 $s$ 爲 $a$ 的卷積所對應的反捲積參數爲 $k'=k$ , $s'=1$ , $p'=k-p-1$ , $i'$ 尺寸爲原輸入每行每列間插入 $s-1$ 個空行列,且在最下行和最右列初再加 $a$ 個空行列.

$o' = s(i' − 1) + a + k - 2p$

空洞卷積

Dumoulin V , Visin F . A guide to convolution arithmetic for deep learning[J]. 2016. ↩︎
圖片來源:https://github.com/vdumoulin/conv_arithmetic ↩︎
這裏討論的是CNN中的反捲積,不同於數學上的反捲積運算. ↩︎

理解CNN中的卷積和反捲積

文章目錄

卷積

各種形式的卷積算法

無填充,單位步長(no zero padding, unit strides)卷積

有填充,單位步長(zero padding, unit strides)卷積

無填充,非單位步長(no zero padding, non-unit strides)卷積

有填充,非單位步長(zero padding, non-unit strides)卷積

反捲積(transposed convolution, deconvolution)

反捲積的數學證明

使用卷積實現反捲積

無填充,單位步長(no zero padding, unit strides)卷積的反捲積

有填充,單位步長(zero padding, unit strides)卷積的反捲積

無填充,非單位步長(no zero padding, non-unit strides)卷積的反捲積

有填充,非單位步長(no zero padding, non-unit strides)卷積的反捲積

空洞卷積

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

一道面試題:寫出SQL語句實現下述功能

控制裝置與儀表隨堂練習答案及知識點總結(一)

MATLAB08:符號運算

MATLAB02:結構化編程和函數定義

機器學習04:決策樹與隨機森林

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結