關於numpy中的廣播與argmax問題

問題背景

最近正在看faster-rcnn的anchor-target-layer.py源碼,其中關於numpy的argmax()問題搞得很混亂。此問題理清楚還需要高清楚numpy的索引的運作原理。


a = np.array([[1,3,5],[2,2,9]])


>>> a.argmax(axis=0)

array([1, 0, 1])


使用argmax(axis=0)的原因是想提取出在行方向上的最大值序號。進而得到行方向上的最大值(每一列的最大值)。可以看出的結構是一個1行3列的array,其中array中的每個值都小於行數,並且值得個數是列數。可以通過以下語句得到行方向上的最大值。

>>> a[a.argmax(axis=0),np.arange(3)]

array([2, 3, 9])


同理,可以得到列方向上的最大值,(每一行的最大值)

>>> a[np.arange(2),a.argmax(axis=1)]

array([5, 9])


argmax函數返回的是序號,在二維情況下,axis=0對應行,axis=1對應列。argmax(axis=0),返回的是行號,行號的個數是列數。同理可知。

在以上操作中

>>>[a.argmax(axis=0),np.arange(3)]

[array([1, 0, 1]), array([0, 1, 2])]

可見,兩個array做爲序號,其實內部使用的是數據組合機制來獲取真實的數據。以上可以等效爲

[a[1,0],a[0,1],a[1,2]]

如此便可以理解了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章