引言:
最近同學在做機器學習作業時,代碼中遇到了*
@
np.mutiply
.dot
這個幾個numpy的運算,發現有點暈,於是我在這裏做幾個簡單的對比,以及列舉需要注意的問題
首先先給一個比較簡單的用法解釋:
*
: 根據數據類型的不同,可能是做點乘運算,也可能做矩陣乘法運算
@
: 只做矩陣乘法運算
.dot
: 只做矩陣乘法運算
np.mutiply
:只做點乘運算
爲了說明上述結論的正確性,下面首先對ndarray數據類型進行運算操作
In [1]: import numpy as np
In [2]: a = np.array(np.arange(4)).reshape(2,2)
In [3]: b = a
In [4]: a
Out[4]:
array([[0, 1],
[2, 3]])
In [5]: b
Out[5]:
array([[0, 1],
[2, 3]])
In [6]: np.multiply(a, b)
Out[6]:
array([[0, 1],
[4, 9]])
In [7]: a * b
Out[7]:
array([[0, 1],
[4, 9]])
In [8]: a.dot(b)
Out[8]:
array([[ 2, 3],
[ 6, 11]])
In [9]: a @ b
Out[9]:
array([[ 2, 3],
[ 6, 11]])
如果array不是方陣,我們再運行測試,得到如下結果
In [16]: a = np.array(np.arange(6)).reshape(3,2)
In [17]: a
Out[17]:
array([[0, 1],
[2, 3],
[4, 5]])
In [18]: b = a.T
In [19]: b
Out[19]:
array([[0, 2, 4],
[1, 3, 5]])
In [20]: b * a
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-20-245d0d068c2b> in <module>()
----> 1 b * a
ValueError: operands could not be broadcast together with shapes (2,3) (3,2)
In [21]: np.multiply(b, a)
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-23-bae4ae98f8ad> in <module>()
----> 1 np.multiply(b, a)
ValueError: operands could not be broadcast together with shapes (2,3) (3,2)
In [22]: b.dot(a)
Out[22]:
array([[20, 26],
[26, 35]])
In [23]: b @ a
Out[23]:
array([[20, 26],
[26, 35]])
從上面可以發現,針對ndarray而言:
*
和 np.multiply
只能做點乘運算,當運算符兩邊的數據維度無法滿足點乘運算結果時,就會報錯
@
和.dot
只能做矩陣乘法運算
然後再對matrix數據類型進行運算操作
In [27]: a = np.matrix(np.arange(4)).reshape(2,2)
In [28]: a
Out[28]:
matrix([[0, 1],
[2, 3]])
In [29]: b = a
In [30]: b
Out[30]:
matrix([[0, 1],
[2, 3]])
In [31]: a * b
Out[31]:
matrix([[ 2, 3],
[ 6, 11]])
In [32]: np.multiply(a,b)
Out[32]:
matrix([[0, 1],
[4, 9]])
In [33]: a @ b
Out[33]:
matrix([[ 2, 3],
[ 6, 11]])
In [34]: a.dot(b)
Out[34]:
matrix([[ 2, 3],
[ 6, 11]])
In [35]: c = np.matrix(np.arange(6)).reshape(3,2)
In [36]: d = c.T
In [37]: c
Out[37]:
matrix([[0, 1],
[2, 3],
[4, 5]])
In [38]: d
Out[38]:
matrix([[0, 2, 4],
[1, 3, 5]])
In [39]: np.multiply(d, c)
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-39-6c3683491fc6> in <module>()
----> 1 np.multiply(d, c)
ValueError: operands could not be broadcast together with shapes (2,3) (3,2)
從上面可以發現,針對matrix而言:
*
會做矩陣乘法運算
而 np.multiply
依然只能做點乘運算,當運算符兩邊的數據維度無法滿足點乘運算結果時,就會報錯。
@
和.dot
依舊保持只做矩陣乘法運算
總結:
爲了防止記混或者出錯,有以下建議:
- 只使用
@
來做矩陣乘法運算 - 只使用
np.multiply
來做點乘運算 - 在使用其他框架,類似於tensorflow或者pytorch,建議先針對這四個運算法運算一遍,明白其運算邏輯再Coding!
如果覺得我有地方講的不好的或者有錯誤的歡迎給我留言,謝謝大家閱讀(點個贊我可是會很開心的哦)~