矩陣求導最簡單的理解

引用 閒話矩陣求導由於github地址找不着該文件了,深表遺憾,以下是百度網盤,需要的可以下載pdf版本的,侵刪。

百度網盤 提取碼:viln

請看完文章再來回頭理解下面的話:

上面有一句話值得注意:事實上,直觀上看,凡是對標量求導,結果的形式都要轉置,而標量對向量和矩陣求導則位置保持不動。

再來看向量對向量求導過程中:
yx
在這裏插入圖片描述
這便不難理解,對於結果的第一行來說,我們可以認爲x1爲標量,yi爲向量,得出的結果轉置了,
在接下來的很多推導過程中,包括矩陣求導的鏈式運算都是根據維度來確定哪些需要轉置,哪些不需要轉置,這些都是非精準的求導法則。

強烈建議讀完這本書,非常棒!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章