tensorflow卷积神经网络中的padding参数最详细解释！

原創

zhuiqiuk

2019-06-11 04:47

tensorflow卷积神经网络中的padding参数最详细解释！

当使用tensorflow创建卷积神经网络时，肯定要用到卷积层和池化层，tendorflow关于建立卷积层和池化层的API都有padding这个参数，如下所示：

- tf.nn.conv2d(input,filter,strides,padding)

- tf.nn.max_pool(input,ksize,strides,padding)

padding有两种可选值：‘VALID’和‘SAME’。

取值为‘VALID’时padding=0，并不会对输入(input)做填充；

取值为‘SAME’时padding>0，将会对输入(input)做填充，填充值都是0值。

下面我将分别对卷积和池化中padding取值为‘VALID’和‘SAME’的区别做详细的解释。

---------------------------------------------------------------------------------------------------------

卷积 tf.nn.conv2d(input,filter,strides,padding)

在tf.nn.conv2d中，padding是在图片周围做填充。

padding='VALID'时不会对图片做填充；

padding='SAME'时情况比较特殊，注意！，这里还要分为两种情况：stride=1和stride>1

1.当且仅当stride=1时，padding='SAME'意味着卷积后的输出与输入size保持一致。例如input的size是5×5，kernel（filter）的size是3×3，令padding='SAME'时（此时padding=1，即在input周围填充了一圈0），output的size将会与input的size保持一致为5×5。

当我们使用tensorflow时，取padding='SAME'时，它自动为我们算出padding的值。既然是详解，那么我们来算一下取padding='SAME'时，padding的值应该取几？先说结论：假如kernel的size是k×k，那么padding=（k-1）/2。

解释：o=（i+2p-k+1）

o为output的size，i为input的size，k为kernal的size，p为padding的取值。以上图为例，i=5，padding=1，k=3，kernel还要向右移动4步加上开始总共生成5个像素（即output的第一行），o就等于5。（如果对卷积过程比较熟悉应该不难理解）

2.当stride>1时，还是直接上公式：

o=((i+2p-k)/s+1)

是不是发现s=1就是上面的公式？当stride>1时，p的取值是能使(i+2p-k)能被s整除的最小值（p>k/2）。

以Alexnet的输入层（227×227）到第二层（55×55）为例子，k=11，stride=4，padding='VALID';

假如我们令padding='SAME',我们看一下输出层size是多少？

能使（227+2p-11）被4整除的最小p值是4，所以o=（（227+2×4-11）/4+1）=57，这时第二层的size就变成了57×57。代码可以在这里获取，有兴趣的可以看一下。

---------------------------------------------------------------------------------------------------------------------

池化 tf.nn.max_pool(input,ksize,strides,padding)

对于tf.nn.max_pool来说，padding='SAME'和'VALID'的区别我们来举例说明：

输入x: 输入图像的shape 是 [2,3], 1个channel
valid_pad: kernel的size为2×2, stride 2 ，padding='VALID'.
same_pad: kernel的size为2×2, stride 2 ，padding='VALID'

输出结果：

valid_pad: 输出的shape 是 [1, 1]
same_pad: 这里我们将会把x的shape填充为 shape [2, 4] (with -inf and then apply max pool), 所以最终输出的 shape 是 [1, 2]

废话不说，上代码：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

tensorflow卷积神经网络中的padding参数最详细解释！

tensorflow卷积神经网络中的padding参数最详细解释！

使用c#强大的表达式树实现对象的深克隆之解决循环引用的问题

GPT-4o 引领人机交互新风向，向量数据库赛道沸腾了

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU启动那些事（12.A）- uSDHC eMMC启动时间(RT1170)

基于Ubuntu-22.04安装K8s-v1.28.2实验（二）使用kube-vip实现集群VIP访问

企业大模型如何成为自己数据的“百科全书”？

本地SSL证书过期输入命令在IIS自动生成

.NET周刊【5月第2期 2024-05-12】

基于Ubuntu-22.04安装K8s-v1.28.2实验（一）部署K8s

基于Ubuntu-22.04安装K8s-v1.28.2实验（三）数据卷挂载NFS（网络文件系统）

Darknet Fine tune模型注意事項

Incremental Learning

IEEE Access投稿（Latex模板）——參考文獻的生成

ICML 2019 | Hinton等人新研究：如何更好地測量神經網絡表示相似性

遷移學習的應用場景以及finetune的使用方法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結