PyTorch中池化层的padding和ceil_mode参数设置

原創

2020-06-16 09:42

在池化操作的接口中，padding和ceil_mode这两个参数会影响到输出特征图的大小。padding即对特征图大小进行扩充的像素数量；ceil_mode指明，当剩余的像素不足滤波器大小，是否仍对这些像素进行运算。
对于池化操作来说，当stride为1时，希望输出与输入保持不变；当stride为2时，希望输出特征图的宽高均为输入的一半。下面以avg_pool2d讲解如何尽量简单达到上述目的：

import torch
import torch.nn.functional as f

y = torch.tensor([[[[1,5,4,9]]]])

print(f.avg_pool2d(y, (1, 3), stride=2, padding=0, ceil_mode=False)) # tensor([[[[3]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=0, ceil_mode=True))  # tensor([[[[3, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), ceil_mode=True))  # tensor([[[[2, 6, 4]]]])

print(f.avg_pool2d(y, (1, 3), stride=1, padding=0, ceil_mode=False)) # tensor([[[[3, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=0, ceil_mode=True))  # tensor([[[[3, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 3, 6, 4]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), ceil_mode=True))  # tensor([[[[2, 3, 6, 4]]]])

stride=2时：
若padding为0，则padding后仍为[1, 5, 4, 9]。第一次运算对[1, 5, 4]进行，得到3（向下取整）；由于stride=2，则第二次运算只剩[4, 9]这一个像素，小于kernel_size，此时，若ceil_mode=False，则直接不对剩余的部分运算，因此输出大小为1；若ceil_mode=True，则对剩余部分继续计算，取[4, 9]的均值6（向下取整），因此输出大小为2。若padding=1，PyTorch的默认padding值为0，则该维度上padding后为[0, 1, 5, 4, 9, 0]，ceil_mode=False时，输出为[2, 6]；ceil_mode=True时，输出为[2, 6, 4]。

stride=1时：
若padding=0，则输出为[3, 6]；若padding=1，输入为[0, 1, 5, 4, 9, 0]，输出为[2, 3, 6, 4]。stride=1时，ceil_mode的值不起作用，始终为False。

总结：

stride=2，padding=1或ceil__mode=True；stride=1时，必须有padding=1，ceil_mode的设置不起作用。

推广：

ceil_mode始终保持PyTorch的默认值False，且padding始终为kernel_size // 2。

PyTorch中池化操作还有一个与padding有关的参数count_include_pad，默认为True。意义是在运算（比如计算平均值或最大值）时，始终将padding的值纳入计算。

import torch
import torch.nn.functional as f
y = torch.tensor([[[[1,5,4,9]]]])

print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), count_include_pad=False, ceil_mode=False)) # tensor([[[[3, 6]]]])

print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 3, 6, 4]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), count_include_pad=False, ceil_mode=False)) # tensor([[[[3, 3, 6, 4]]]])

如在上述例子中，stride=2，padding=1，ceil_mode=False时，若将count_include_pad设为False，则结果由[2, 6]变为[3, 6]。一般的，进行平均池化时，将该参数设为False；进行最大池化时，可保持默认不变，为True。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

PyTorch中池化层的padding和ceil_mode参数设置

总结：

推广：

Nginx R31 doc 官方文档-01-nginx 如何安装

挑战程序设计竞赛 2.2章习题 POJ - 3617 Best Cow Line 贪心

golang开发环境搭建(win10)

torch.nn.Module源碼學習

LeetCode總結：雙指針在鏈表中的應用

PyTorch中池化層的padding和ceil_mode參數設置

C++虛函數的實現機制——虛函數表

python獲得變量的類名

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結