舉例說明,tf.slice()的用法

轉載自:https://www.jianshu.com/p/71e6ef6c121b

最近看代碼的時候需要弄明白tf.slice()的具體操作方法。去看了看官方的註釋和例子還是一頭霧水,就是看不明白這到底是怎麼切的。於是搜了幾個quora的帖子,終於搞懂了。下面舉3個例子🌰解釋一下切割原理。


首先看一眼源代碼註釋是怎麼說的:

This operation extracts a slice of size `size` from a tensor `input` starting at the location specified by `begin`. The slice `size` is represented as tensor shape, where `size[i]` is the number of elements of the 'i'th dimension of `input` that you want to slice. The starting location (`begin`) for the slice is represented as an offset in each dimension of `input`. In other words, `begin[i]` is the offset into the 'i'th dimension of `input` that you want to slice from.

方程的signature是這樣的:

def slice(input_, begin, size, name=None):

其中“input_”是你輸入的tensor,就是被切的那個。

“begin”是每一個維度的起始位置,這個下面詳細說。

“size”相當於問每個維度拿幾個元素出來。


下面看例1:

t = tf.constant([[[1, 1, 1], [2, 2, 2]], [[3, 3, 3], [4, 4, 4]], [[5, 5, 5], [6, 6, 6]]])

tf.slice(t, [1, 0, 0], [1, 1, 3])

這個輸出是:

[[[3, 3, 3]]]

首先作爲一個3維數組t,你要先明白他的shape是[3,2,3].  


Shape:

這個shape是怎麼來的呢?咱們把這個t分解一下看就好理解了。那一大堆有括號的t,只看它最外面的括號的話,可以看成是:

t = [A, B, C]   #這是第一維度

然後每一個裏面有兩個東西,可以寫成:

A = [i, j], B = [k, l], C = [m, n]  #這是第二維度

最後,這i, j, k, l, m, n裏面分別是:

i = [1, 1, 1], j = [2, 2, 2], k = [3, 3 ,3], l = [4, 4, 4], m = [5, 5, 5], n = [6, 6, 6]  # 這是第三維度

所以shape就是中括號 [ ] 的層級裏單位的數量。

對於t來說,最外面括號裏有3個東西,分別是A, B, C。這三個東西每個裏面有兩個玩意兒, i和j, k和l, m和n。

他們裏面每一個又有3個數字。所以t的shape是[3,2,3]。這是我的理解方式。


Slice:

在解釋slice之前,有一點要知道的是python的數組index是從0開始的。

有了這個基礎,我們再來看例子:

tf.slice(t, [1, 0, 0], [1, 1, 3])  # begin = [1, 0, 0]

這裏根據順序我們知道,begin是[1, 0, 0], size是[1, 1, 3].  他們兩個數組的意義是從左至右,每一個數字代表一個維度。上面說了begin的意思是起始位置,那麼[1, 0, 0]的意思是在3個維度中,每個維度從哪裏算起。

第一維度是[A, B, C]。 begin裏[1, 0, 0]是1,也就是從B算起。其次第二維度裏B = [k, l](注意啊,我這裏只寫了B = [k, l],可不代表只有B有用,如果size裏第一個數字是2的話,B和C都會被取的),begin裏第二個數是0,也就是從k算起。第三維度k = [3, 3 ,3],begin裏第三個數是0,就是從第一個3算起。

到現在都能看懂吧?知道了這三個起始點之後,再來看size。

size的意思是每個維度的大小,也就是每個維度取幾個元素。size的應該是最後輸出的tensor的shape。

例子裏面:

tf.slice(t, [1, 0, 0], [1, 1, 3])  # size = [1, 1, 3]

size裏第一個是1,意思是在第一個維度取1個元素。t = [A, B, C] begin是起算是B,取一個那就是B了唄。那麼第一維度結果就是[B]

size第二個也是1,第二維度B = [k, l], begin裏起算是k,取一個是k。那麼第二維度結果是[[k]]

size第三個是3,第三維度k = [3, 3 ,3],begin裏起算是第一個3。三個3取3個數,那就要把三個3都取了,所以是

[[[3, 3, 3]]]

看懂了嗎?是不是有點像代數?[B]裏把B換成[k], 再把k換成[3, 3 ,3]。最後注意中括號的數量,和size一樣是[1, 1, 3].


例2:

t = tf.constant([[[1, 1, 1], [2, 2, 2]], [[3, 3, 3], [4, 4, 4]], [[5, 5, 5], [6, 6, 6]]])

tf.slice(t, [1, 0, 0], [1, 2, 3])

看懂了第一個,再看第二個就簡單了。這裏begin還是一樣[1, 0 ,0]。 size第一個維度取一個,還是[B]。然後這裏不是1了,是2,意思是取兩個。還記得B = [k, l]嗎?現在不是隻要k了,是k和l都要。第三維度取3個,也就是說不光是k = [3, 3 ,3],l = [4, 4, 4]也要slice走。

總結一下,第一維度取[B]。第二維度裏把B換成[k, l],就變成了[[k, l]]. 第三維度裏把k換成[3, 3 ,3],把l 換成 [4, 4, 4],替換後是最終結果

[[[3, 3, 3], [4, 4, 4]]]

是不是覺得看懂了也挺簡單的,只是可能不太習慣這種思維方式。


例3:

t = tf.constant([[[1, 1, 1], [2, 2, 2]], [[3, 3, 3], [4, 4, 4]], [[5, 5, 5], [6, 6, 6]]])

tf.slice(t, [1, 0, 0], [-1, -1, -1])

對於這種情況,源代碼註釋中有一句話:

If `size[i]` is -1, all remaining elements in dimension i are included in the slice. In other words, this is equivalent to setting: `size[i] = input.dim_size(i) - begin[i]`

也就是說,如果size輸入值是-1的話,在那個維度剩下的數都會slice走。上面的例子中,begin是[1, 0, 0]。三個維度都是-1的話,那麼結果: 第一維度是[B,C];第二維度是[[k, l], [m, n]]; 第三維度是[[[3,3,3], [4,4,4]], [[5,5,5], [6,6,6]]]

 



作者:木木愛吃糖醋魚
鏈接:https://www.jianshu.com/p/71e6ef6c121b
來源:簡書
簡書著作權歸作者所有,任何形式的轉載都請聯繫作者獲得授權並註明出處。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章