引用 閒話矩陣求導由於github地址找不着該文件了,深表遺憾,以下是百度網盤,需要的可以下載pdf版本的,侵刪。
百度網盤 提取碼:viln
請看完文章再來回頭理解下面的話:
上面有一句話值得注意:事實上,直觀上看,凡是對標量求導,結果的形式都要轉置,而標量對向量和矩陣求導則位置保持不動。
再來看向量對向量求導過程中:
這便不難理解,對於結果的第一行來說,我們可以認爲x1爲標量,yi爲向量,得出的結果轉置了,
在接下來的很多推導過程中,包括矩陣求導的鏈式運算都是根據維度來確定哪些需要轉置,哪些不需要轉置,這些都是非精準的求導法則。
強烈建議讀完這本書,非常棒!