关于numpy中的广播与argmax问题

问题背景

最近正在看faster-rcnn的anchor-target-layer.py源码,其中关于numpy的argmax()问题搞得很混乱。此问题理清楚还需要高清楚numpy的索引的运作原理。


a = np.array([[1,3,5],[2,2,9]])


>>> a.argmax(axis=0)

array([1, 0, 1])


使用argmax(axis=0)的原因是想提取出在行方向上的最大值序号。进而得到行方向上的最大值(每一列的最大值)。可以看出的结构是一个1行3列的array,其中array中的每个值都小于行数,并且值得个数是列数。可以通过以下语句得到行方向上的最大值。

>>> a[a.argmax(axis=0),np.arange(3)]

array([2, 3, 9])


同理,可以得到列方向上的最大值,(每一行的最大值)

>>> a[np.arange(2),a.argmax(axis=1)]

array([5, 9])


argmax函数返回的是序号,在二维情况下,axis=0对应行,axis=1对应列。argmax(axis=0),返回的是行号,行号的个数是列数。同理可知。

在以上操作中

>>>[a.argmax(axis=0),np.arange(3)]

[array([1, 0, 1]), array([0, 1, 2])]

可见,两个array做为序号,其实内部使用的是数据组合机制来获取真实的数据。以上可以等效为

[a[1,0],a[0,1],a[1,2]]

如此便可以理解了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章