求導佈局:
分子佈局(numerator layout):
m維列向量對標量求導結果爲m維列向量,標量對m*n維矩陣求導結果爲n*m維,m維列向量對n維列向量求導結果爲m*n維(雅克比矩陣)
分母佈局(denominator layout):
m維列向量對標量求導結果爲m維行向量,標量對m*n維矩陣求導結果爲m*n維,m維列向量對n維列向量求導結果爲n*m維(梯度矩陣)
一般規則:
向量或矩陣對標量求導一般爲分子佈局,標量對向量或矩陣求導一般爲分母佈局,向量對向量求導看具體情況。
定義法求導
標量對向量的求導
sample 1
設
其中x爲n維列向量,則y對x的導數爲:
sample 2
設
則導數爲:
其中,
標量對矩陣的求導
設
其中,a爲m維行向量,X爲m*n矩陣,b爲n維行向量。
則:
故
向量對向量的求導
設A爲m*n矩陣,x爲n維向量,y爲m維向量,y對x的求導結果爲m*n矩陣
微分法求導
標量對矩陣的微分
標量對向量的微分也如上式。因爲偏導使用分母佈局,故需轉置後乘以dX。
矩陣微分性質
跡的性質
使用微分法求導上例:
例2,
跡函數對向量矩陣的求導
由定義方法可知:
鏈式求導法則
向量對向量
標量對多個向量鏈式求導
直接用鏈式法則會碰到維度不相容的情況,可以求其轉置
假設想,x,y分別爲m,n維向量:
標量對多個矩陣鏈式求導
矩陣對矩陣求導
一般先對矩陣向量化(列向量),使用向量對向量的求導,即
矩陣向量化的運算法則
克羅內克積的運算法則
例如,