PyTorch中池化层的padding和ceil_mode参数设置

在池化操作的接口中,padding和ceil_mode这两个参数会影响到输出特征图的大小。padding即对特征图大小进行扩充的像素数量;ceil_mode指明,当剩余的像素不足滤波器大小,是否仍对这些像素进行运算。
对于池化操作来说,当stride为1时,希望输出与输入保持不变;当stride为2时,希望输出特征图的宽高均为输入的一半。下面以avg_pool2d讲解如何尽量简单达到上述目的:

import torch
import torch.nn.functional as f

y = torch.tensor([[[[1,5,4,9]]]])

print(f.avg_pool2d(y, (1, 3), stride=2, padding=0, ceil_mode=False)) # tensor([[[[3]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=0, ceil_mode=True))  # tensor([[[[3, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), ceil_mode=True))  # tensor([[[[2, 6, 4]]]])

print(f.avg_pool2d(y, (1, 3), stride=1, padding=0, ceil_mode=False)) # tensor([[[[3, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=0, ceil_mode=True))  # tensor([[[[3, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 3, 6, 4]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), ceil_mode=True))  # tensor([[[[2, 3, 6, 4]]]])

stride=2时:
若padding为0,则padding后仍为[1, 5, 4, 9]。第一次运算对[1, 5, 4]进行,得到3(向下取整);由于stride=2,则 第二次运算只剩[4, 9]这一个像素,小于kernel_size,此时,若ceil_mode=False,则直接不对剩余的部分运算,因此输出大小为1;若ceil_mode=True,则对剩余部分继续计算,取[4, 9]的均值6(向下取整),因此输出大小为2。若padding=1,PyTorch的默认padding值为0,则该维度上padding后为[0, 1, 5, 4, 9, 0],ceil_mode=False时,输出为[2, 6];ceil_mode=True时,输出为[2, 6, 4]。

stride=1时:
若padding=0,则输出为[3, 6];若padding=1,输入为[0, 1, 5, 4, 9, 0],输出为[2, 3, 6, 4]。stride=1时,ceil_mode的值不起作用,始终为False。

总结:

stride=2,padding=1或ceil__mode=True;stride=1时,必须有padding=1,ceil_mode的设置不起作用。

推广:

ceil_mode始终保持PyTorch的默认值False,且padding始终为kernel_size // 2。

PyTorch中池化操作还有一个与padding有关的参数count_include_pad,默认为True。意义是在运算(比如计算平均值或最大值)时,始终将padding的值纳入计算。

import torch
import torch.nn.functional as f
y = torch.tensor([[[[1,5,4,9]]]])

print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), count_include_pad=False, ceil_mode=False)) # tensor([[[[3, 6]]]])

print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 3, 6, 4]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), count_include_pad=False, ceil_mode=False)) # tensor([[[[3, 3, 6, 4]]]])

如在上述例子中,stride=2,padding=1,ceil_mode=False时,若将count_include_pad设为False,则结果由[2, 6]变为[3, 6]。一般的,进行平均池化时,将该参数设为False;进行最大池化时,可保持默认不变,为True。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章