在進行對向量的求導時,非常好用的三個公式~

在進行對向量的求導時,非常好用的三個公式
分別是
1.對於向量x求導xwTx=w\nabla_x w^Tx=w
2.對向量x求導xxTAx=(A+AT)x\nabla_x x^TAx=(A+A^T)x其中x爲向量,A爲矩陣
3.對向量x求二階導(即Hessian矩陣)2xTAx=A+AT\nabla ^2 x^TAx=A+A^T


詳細的證明
1.對於向量x求導
xwTx=w\nabla_x w^Tx=w
證明:
wTx=(w1w2...wn)(x1x2...xn)=i=1nwixiw^Tx=\begin{pmatrix}w_1&w_2&...&w_n\end{pmatrix}\cdot\begin{pmatrix}x_1\\x_2\\...\\x_n\end{pmatrix}\\ =\sum\limits_{i=1}^nw_ix_i
所以對xix_i求導,對應的導數爲wiw_i
xwTx=w\nabla_x w^Tx=w


2.對向量x求導
xxTAx=(A+AT)x\nabla_x x^TAx=(A+A^T)x
其中x爲向量,A爲矩陣

證明:
對於二次型xTAxx^TAx
xTAx=(x1x2...xn)(a11a12...a1na21a22...a2n..an1an2...ann)(x1x2...xn)=(x1x2...xn)(a11x1+a12x2+...+a1nxna21x1+a22x2+...+a2nxn...an1x1+an2x2+...+annxn)=a11x1x1+a12x1x2+...+a1nx1xn+a21x2x1+a22x2x2+...+a2nx2xn+...+an1xnx1+an2xnx2+...+annxnxn=i=1nj=1naijxixjx^TAx=\begin{pmatrix}x_1&x_2&...&x_n\end{pmatrix}\begin{pmatrix} a_{11}&a_{12}&...&a_{1n}\\a_{21}&a_{22}&...&a_{2n}\\.\\.\\a_{n1}&a_{n2}&...&a_{nn}\end{pmatrix}\begin{pmatrix}x_1\\x_2\\...\\\\x_n\end{pmatrix}\\ =\begin{pmatrix}x_1&x_2&...&x_n\end{pmatrix}\begin{pmatrix}a_{11}x_1+a_{12}x_2+...+a_{1n}x_{n}\\a_{21}x_1+a_{22}x_2+...+a_{2n}x_n\\...\\a_{n1}x_1+a_{n2}x_2+...+a_{nn}x_n\end{pmatrix}\\ =a_{11}x_1x_1+a_{12}x_1x_2+...+a_{1n}x_1x_n+a_{21}x_2x_1+a_{22}x_2x_2+...+a_{2n}x_2x_n +...+a_{n1}x_nx_1+a_{n2}x_nx_2+...+a_{nn}x_nx_n \\ =\sum\limits_{i=1}^n\sum\limits_{j=1}^na_{ij}x_ix_j
其中,若只對x1x_1求導則整理上式
xTAx=a11x1x1+i=2nai1xix1+j=2na1jxjx1+cx^TAx=a_{11}x_1x_1+\sum\limits_{i=2}^na_{i1}x_ix_1+\sum\limits_{j=2}^na_{1j}x_{j}x_1+c
x1x_1求導,則上式爲
2a11x1+i=2nai1xi+j=2na1jxj=j=1na1jxj+j=1na1jxj=A[1,:]x+AT[1,:]x2a_{11}x_1+\sum\limits_{i=2}^na_{i1}x_i+\sum\limits_{j=2}^na_{1j}x_{j}\\ =\sum\limits_{j=1}^na_{1j}x_{j}+\sum\limits_{j=1}^na_{1j}x_{j}\\ =A[1,:]\cdot x +A^T[1,:]\cdot x
由此可知,對x求導後,導數爲
(A+AT)x(A+A^T)\cdot x


3.對向量x求二階導(即Hessian矩陣)2xTAx=A+AT\nabla ^2 x^TAx=A+A^T

證明:
對於二次型xTAx=i=1nj=1nxixjaijx^TAx=\sum\limits_{i=1}^n\sum\limits_{j=1}^nx_ix_ja_{ij}
而海森矩陣的每一個元素Hij=2fxixjH_{ij}=\frac{\partial ^2f}{\partial x_i\partial x_j}

如求HijH_{ij}
則需要找到原等式中,存在xixjx_ix_j的項
Hij=2fxixj=aij+ajiH_{ij}=\frac{\partial ^2f}{\partial x_i\partial x_j}=a_{ij}+a_{ji}
H=A+ATH=A+A^T

這個二階偏導數的形式也與一元函數的二階導數形式上統一

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章