轉載自原文鏈接:https://blog.csdn.net/leviopku/article/details/82380118
tensorflow中用來拼接張量的函數tf.concat(),用法:
tf.concat([tensor1, tensor2, tensor3,...], axis)
先給出tf源代碼中的解釋:
t1 = [[1, 2, 3], [4, 5, 6]]
t2 = [[7, 8, 9], [10, 11, 12]]
tf.concat([t1, t2], 0) # [[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]]
tf.concat([t1, t2], 1) # [[1, 2, 3, 7, 8, 9], [4, 5, 6, 10, 11, 12]]
# tensor t3 with shape [2, 3]
# tensor t4 with shape [2, 3]
tf.shape(tf.concat([t3, t4], 0)) # [4, 3]
tf.shape(tf.concat([t3, t4], 1)) # [2, 6]
這裏解釋了當axis=0和axis=1的情況,怎麼理解這個axis呢?其實這和numpy中的np.concatenate()用法是一樣的。
axis=0 代表在第0個維度拼接
axis=1 代表在第1個維度拼接
對於一個二維矩陣,第0個維度代表最外層方括號所框下的子集,第1個維度代表內部方括號所框下的子集。維度越高,括號越小。
對於這種情況,我可以再解釋清楚一點:
對於[ [ ], [ ]]和[[ ], [ ]],低維拼接等於拿掉最外面括號,高維拼接是拿掉裏面的括號(保證其他維度不變)。注意:tf.concat()拼接的張量只會改變一個維度,其他維度是保存不變的。比如兩個shape爲[2,3]的矩陣拼接,要麼通過axis=0變成[4,3],要麼通過axis=1變成[2,6]。改變的維度索引對應axis的值。
這樣就可以理解多維矩陣的拼接了,可以用axis的設置來從不同維度進行拼接。
對於三維矩陣的拼接,自然axis取值範圍是[0, 1, 2]。
對於axis等於負數的情況
負數在數組索引裏面表示倒數(countdown)。比如,對於列表ls = [1,2,3]而言,ls[-1] = 3,表示讀取倒數第一個索引對應值。
axis=-1表示倒數第一個維度,對於三維矩陣拼接來說,axis=-1等價於axis=2。同理,axis=-2代表倒數第二個維度,對於三維矩陣拼接來說,axis=-2等價於axis=1。
一般在維度非常高的情況下,我們想在最'高'的維度進行拼接,一般就直接用countdown機制,直接axis=-1就搞定了。