TensorFlow中CNN的兩種padding方式“SAME”和“VALID”

轉載請標明出處：http://blog.csdn.net/wuzqchom/article/details/74785643

在用tensorflow寫CNN的時候，調用卷積核api的時候，會有填padding方式的參數，找到源碼中的函數定義如下（max pooling也是一樣）：

def conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None,
data_format=None, name=None)

源碼中對於padding參數的說明如下：

padding: A string from: "SAME", "VALID".
The type of padding algorithm to use.

說了padding可以用“SAME”和“VALID”兩種方式，但是對於這兩種方式具體是什麼並沒有多加說明。
這裏用Stack Overflow中的一份代碼來簡單說明一下，代碼如下：

x = tf.constant([[1., 2., 3.],
                 [4., 5., 6.]])

x = tf.reshape(x, [1, 2, 3, 1])  # give a shape accepted by tf.nn.max_pool

valid_pad = tf.nn.max_pool(x, [1, 2, 2, 1], [1, 2, 2, 1], padding='VALID')
same_pad = tf.nn.max_pool(x, [1, 2, 2, 1], [1, 2, 2, 1], padding='SAME')

print(valid_pad.get_shape())
print(same_pad.get_shape())

最後輸出的結果爲：

(1, 1, 1, 1)
(1, 1, 2, 1)

可以看出“SAME”的填充方式是比“VALID”的填充方式多了一列。
讓我們來看看變量x是一個2x3的矩陣，max pooling窗口爲2x2，兩個維度的strides=2。
第一次由於窗口可以覆蓋（橙色區域做max pool操作），沒什麼問題，如下：

1	2	3
4	5	6

接下來就是“SAME”和“VALID”的區別所在，由於步長爲2，當向右滑動兩步之後“VALID”發現餘下的窗口不到2x2所以就把第三列直接去了，而“SAME”並不會把多出的一列丟棄，但是隻有一列了不夠2x2怎麼辦？填充！

1	2	3	0
4	5	6	0

如上圖所示，“SAME”會增加第四列以保證可以達到2x2，但爲了不影響原來的圖像像素信息，一般以0來填充。(這裏使用表格的形式展示，markdown不太好控制格式，明白意思就行)，這就不難理解不同的padding方式輸出的形狀會有所不同了。

在CNN用在文本中時，一般卷積層設置卷積核的大小爲n×k，其中k爲輸入向量的維度（即[n,k,input_channel_num,output_channel_num]），這時候我們就需要選擇“VALID”填充方式，這時候窗口僅僅是沿着一個維度掃描而不是兩個維度。可以理解爲統計語言模型當中的N-gram。

我們設計網絡結構時需要設置輸入輸出的shape，源碼nn_ops.py中的convolution函數和pool函數給出的計算公式如下：

 If padding == "SAME":
      output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides[i])

    If padding == "VALID":
      output_spatial_shape[i] =
        ceil((input_spatial_shape[i] -
              (spatial_filter_shape[i]-1) * dilation_rate[i])
              / strides[i]).

參考：
1.https://blog.csdn.net/wuzqchom/article/details/74785643

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

TensorFlow中CNN的兩種padding方式“SAME”和“VALID”

C語言--右移左移

12款高效開源Wiki系統推薦，打造團隊知識管理利器

一個開源且全面的C#算法實戰教程

dotnet 基於 DirectML 控制檯運行 Phi-3 模型

自定義MyBatis插件

一款.NET開源、功能強大、跨平臺的繪圖庫 - OxyPlot

常用的 Git 指令

鼠標控制軟件有可能和虛擬機軟件產生衝突

sm4加密工具類

CPU, GPU, FPGA計算能力

目標檢測--RCNN算法架構及關鍵技術解析

卷積操作的幾種類型

CNN中的多通道卷積（RGB等）

目標檢測--Fast RCNN詳解-多細節

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結