速查：卷積核參數計算公式

原創

qjgods

2020-02-21 05:27

文章目錄

卷積公式

參考資料

使用符號：
輸入尺寸（input）： $i$
卷積核大小（kernel size）： $k$
步幅（stride）： $s$
邊界擴充（padding）： $p$
輸出尺寸（output）： $o$

卷積公式

沒有padding，且s=1

公式1：對於任意的i和k，如果 $s=1,p=0$ ,則
$o=(i-k)+1$

有padding，且s=1

公式2：對於任意的i和k,p，如果 $s=1$ ,則
$o=(i-k)+2p+1$

Half (same) padding

公式3：如果我們希望輸出的大小等於輸入的大小，那麼首先保證，k是奇數，於是對於任意的i，對於奇數的 $k=2n+1$ , $s=1,p=\lfloor k/2 \rfloor=n$ ，於是
$\begin{aligned} o &=i+2\lfloor k / 2\rfloor-(k-1) \\ &=i+2 n-2 n \\ &=i \end{aligned}$

這也是爲什麼，參數組合k=3,s=1,p=1以及k=5,s=1,p=2那麼常見的原因，他們不會改變output的大小。

Full padding

這是一種讓input size增加的padding設置方式：
公式4：對於任意的 $i,k$ ,並設 $p=k-1,s=1$ 則
$\begin{array}{l} {o=i+2(k-1)-(k-1)} \\ {\quad=i+(k-1)} \end{array}$

沒有padding，s>1

上面都是討論s=1的情況，現在討論s>1的情況，首先沒有padding的話公式是：
公式5：對於任意的 $i,k,s$ ,若 $p=0$ ，則
$o=\lfloor \frac{i-k}{s}\rfloor+1$

有padding，s>1

現在如果有padding：
公式6：對於任意的 $i,k,s,p$
$o=\lfloor \frac{i+2p-k}{s}\rfloor+1$

可以看到，s的增加會使得i成倍地減少，如果想要讓 $o=i/2$ ，一個最常用的配置是設s=2,然後 $-2\le 2p-k \le -1$ ，也就是 $s=2,p=1,k=4$ ,或者 $s=2,p=1,k=3$ 都可以

Pooling 公式

pooling其實只是一種特別的卷積核，所以他的計算公式跟卷積是一模一樣的，而且由於pooling是沒有padding的，所以他的計算公式就是：
公式7：對於任意的 $i,k,s$
$o=\lfloor \frac{i-k}{s}\rfloor+1$

反捲積公式

沒有padding，且s=1

公式8如果正向卷積對於任意的 $k$ ，且 $s=1,p=0$ ,那麼如果其反捲積的設置爲 $k'=k,s'=s,p'=k-1$ ，則反捲積的輸出大小爲：
$o'=i'+(k-1)$
顯然，這個跟公式1是一一對應的，（根據公式1，可以推出 $i=o-1+k$ ）

有padding，且s=1

公式9：如果正向卷積對於任意的 $k,p$ ，且 $s=1$ ,那麼如果其反捲積的設置爲 $k'=k,s'=s,p'=k-p-1$ ，則反捲積的輸出大小爲：
$o'=i'+(k-1)-2p$
類似的，這個公式是跟公式2一一對應的。顯然，當 $k=3,s=1,p=1$ 時，其反捲積的參數恰好也是 $k'=3,s'=1,p'=3-1-1=1$ ，是一模一樣的，另外一個常用的配置是, $k=5,s=1,p=3$ ,此時，反捲積的參數也是跟正向卷積一樣的。

Half (same) padding

公式10: 如果正向卷積對於任意的 $k=2n+1$ 爲奇數，且 $s=1,p=\lfloor k/2 \rfloor=n$ ,那麼如果其反捲積的設置爲 $k'=k,s'=s,p'=p$ ，則反捲積的輸出大小爲：
$\begin{aligned} o^{\prime} &=i^{\prime}+(k-1)-2 p \\ &=i^{\prime}+2 n-2 n \\ &=i^{\prime} \end{aligned}$

這個公式是跟公式3是一一對應的，反捲積同意也能得到相同大小的output與input。

Full padding

這是對應於公式4的反捲積，將input減少的
公式11: 如果正向卷積對於任意的 $k$ ，且 $s=1,p=k-1$ ,那麼如果其反捲積的設置爲 $k'=k,s'=s,p'=0$ ，則反捲積的輸出大小爲：
$\begin{aligned} o^{\prime} &=i^{\prime}+(k-1)-2 p \\ &=i^{\prime}-(k-1) \end{aligned}$

沒有padding，且s>1

在反捲積中，如果s>1，那麼它在像素間插入空白的間隔，如下圖所示：

經過擴大的圖大小變成了
$\hat{i'}=i+(s-1)(i-1)$
每一塊輸入之間都插入了(s-1)個空白點。經過插入後的大小記爲 $\hat{i'}$

公式12: 如果正向卷積對於任意的 $k,s$ ，且 $p=0$ ,以及 $i-k$ 是 $s$ 的整數倍，那麼如果其反捲積，將想原始圖像的輸入拓展成 $\hat{i'}=i+(s-1)(i-1)$ ，然後設置爲 $k'=k,s'=1,p'=k-1$ ，則反捲積的輸出大小爲：
$o'=s(i'-1)+k$

有padding，且s>1

公式13: 如果正向卷積對於任意的 $k,s,p$ ，以及 $i+2p-k$ 是 $s$ 的整數倍，那麼如果其反捲積，將想原始圖像的輸入拓展成 $\hat{i'}=i+(s-1)(i-1)$ ，然後設置爲 $k'=k,s'=1,p'=k-p-1$ ，則反捲積的輸出大小爲：
$o'=s(i'-1)+k-2p$

在上面爲了方便計算，都是假設是整數倍，如果沒有這個假設，那麼：
公式14: 如果正向卷積對於任意的 $k,s,p$ ，，那麼如果其反捲積，將想原始圖像的輸入拓展成 $\hat{i'}=i+(s-1)(i-1)$ ，然後設置爲 $k'=k,s'=1,p'=k-1$ ，則反捲積的輸出大小爲：

$o'=s(i'-1)+a+k-2p$

其中 $a=(i+2p-k) \mod s$ .

暴力測試參數數量

說實話。。最方便的方法還是直接寫代碼測測維度大小：

import torch
import torch.nn as nn

def paras_cnn(k,s,p,i=64):
    x=torch.ones(1,1,i,i)
    conv = torch.nn.Conv2d(1, 1, kernel_size=k, stride=s, padding=p)
    convt= torch.nn.ConvTranspose2d(1, 1, kernel_size=k, stride=s, padding=p)
    h1=conv(x)
    h2=convt(x)
    y=convt(h1)
    print("conv(x):{} \t convT(x):{} \t convT(conv(x)):{}".format((h1.shape[2],h1.shape[3]),(h2.shape[2],h2.shape[3]),(y.shape[2],y.shape[3])))
    return h1.shape[2],h1.shape[3],h2.shape[2],h2.shape[3],y.shape[2],y.shape[3]

參考資料

https://arxiv.org/abs/1603.07285
https://zhuanlan.zhihu.com/p/57348649

qjgods

發佈了70 篇原創文章 · 獲贊 239 · 訪問量 45萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

速查：卷積核參數計算公式

文章目錄

卷積公式

沒有padding，且s=1

有padding，且s=1

Half (same) padding

Full padding

沒有padding，s>1

有padding，s>1

Pooling 公式

反捲積公式

沒有padding，且s=1

有padding，且s=1

Half (same) padding

Full padding

沒有padding，且s>1

有padding，且s>1

暴力測試參數數量

參考資料

.Net 8.0 下的新RPC，IceRPC之試試的新玩法"打洞"

關於遊戲付費的一點想法

我通過CKA和CKS啦！

《最新出爐》系列入門篇-Python+Playwright自動化測試-42-強大的可視化追蹤利器Trace Viewer

大數據怎麼學？對大數據開發領域及崗位的詳細解讀，完整理解大數據開發領域技術體系

理解Jacobian矩陣與分佈變換

無痛理解梯度下降

使用SVD來求解優化問題最優值以及求解PCA

理解意向性分析(intention-to-treat, ITT)

Propensity score簡介

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結