數據挖掘day9-CS229-Linear Algebra Review and Reference

因爲計劃先看的凸優化,但是發現其中很多符號不認識(不同的機構使用的不一定一樣)。過兩天纔看到這個線性代數綜述,我覺得應該是我的順序搞反了,所以,將這一篇的日期順序排的靠前點。其實我更推薦看原文章或翻譯:中文翻譯,不過這裏我會把公式都打出來,主要是聯繫一下Latax。
(未完待填坑)

1、基本概念和符號

方程組:
4x15x2=134x_1-5x_2=-13
2x1+3x2=9-2x_1+3x_2=9

可以寫成線性代數的形式:

Ax=bAx=b 其中: A=[4513]A=\left[\begin{matrix} 4&-5\\ -1&3 \end{matrix} \right],b=[139]b=\left[\begin{matrix}-13\\ 9\end{matrix} \right]

1.1、基本符號

採用以下符號:
· ARm×nA \in \mathbb{R}^{m×n} ,表示一個m行n列的矩陣,並且矩陣A中的所有元素都是實數。
· xRnx \in \mathbb{R}^{n} ,表示一個含有n個元素的向量,通常,我們把n維向量看成是一個n行1列矩陣,即列向量。如果我們想表示一個行向量(1行n列矩陣),我們通常寫作xTx^T,即x的轉置。
· 向量的第i個元素寫作xix_i

x=[x1x2xn]x=\left[\begin{matrix} x_1\\x_2\\ \vdots \\x_n \end{matrix} \right]

·採用aij(orAij,Ai,j,etc)a_{ij }(or A_{ij} , A_{i,j} , etc)表示A的iijj列元素

A=[a11a12a1na21a22a2nam1am2amn]A=\left[\begin{matrix} a_{11}&a_{12}& \cdots &a_{1n}\\a_{21}&a_{22}& \cdots &a_{2n}\\ \vdots& \vdots&\ddots&\vdots\\a_{m1}&a_{m2}& \cdots &a_{mn} \end{matrix} \right]

·採用aj(orA:,j)a_{j }(or A_{:,j} )表示A的jj列元素

A=[a1a2an]A=\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right]

·採用aiT(orAi,:)a_{i}^T(or A_{i,:} )表示A的ii行元素

A=[a1Ta2TamT]A=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right]

2、矩陣乘法

百度百科-矩陣乘法
矩陣ARm×nA \in \mathbb{R}^{m×n}BRn×PB \in \mathbb{R}^{n×P}的乘積:
C=ABRm×pC=AB\in \mathbb{R}^{m×p}
其元素爲Cij=k=1nAikBkjC_{ij}= \displaystyle \sum_{k=1}^nA_{ik}B_{kj}

2.1、向量乘積

內積:
x,yRnx,y \in \mathbb{R}^n,的點積/內積爲xTyx^Ty,是一個實數
xTyR=[x1x2xn][y1y2yn]=i=1nxiyix^Ty \in \mathbb{R}=\left[\begin{matrix} x_1&x_2&\cdots&x_n \end{matrix} \right] \left[\begin{matrix} y_1\\y_2\\ \vdots\\y_n \end{matrix} \right]= \displaystyle \sum_{i=1}^nx_{i}y_{i}

內積是矩陣乘法的特例,通常xTy=yTxx^Ty=y^Tx

外積:
xRm,yRnx \in \mathbb{R}^m,y \in \mathbb{R}^nxyTRm×nxy^T \in \mathbb{R}^{m×n}爲向量的外積

xyTRm×n=[x1x2xn][y1y2yn]=[x1y1x1y2x1ynx2y1x2y2x2ynxmy1xmy2xmyn]xy^T \in \mathbb{R}^{m×n}=\left[\begin{matrix} x_1\\x_2\\ \vdots\\x_n \end{matrix} \right] \left[\begin{matrix} y_1&y_2& \cdots&y_n \end{matrix} \right]= \left[\begin{matrix} x_1y_1&x_1y_2& \cdots &x_1y_n\\x_2y_1&x_2y_2& \cdots &x_2y_n\\ \vdots& \vdots&\ddots&\vdots\\x_my_1&x_my_2& \cdots &x_my_n \end{matrix} \right]

外積寫法的例子,1Rn1 \in \mathbb {R}^n是元素都爲1的n維向量,ARm×nA \in \mathbb{R}^{m×n}是m行n列矩陣,每一列都是xRmx \in \mathbb{R}^m,A可以簡潔的寫作

A=[xxx]=[x1x1x1x2x2x2xmxmxm]=[x1x1x1][y1y2yn]=x1TA=\left[\begin{matrix} |&|& &|\\x&x& \cdots &x\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} x_1&x_1& \cdots &x_1\\x_2&x_2& \cdots &x_2\\ \vdots& \vdots&\ddots&\vdots\\x_m&x_m& \cdots &x_m\end{matrix} \right]=\left[\begin{matrix} x_1\\x_1\\ \vdots \\x_1 \end{matrix} \right]\left[\begin{matrix} y_1&y_2& \cdots&y_n \end{matrix} \right]=x1^T

2.2、矩陣-向量乘法

右乘列向量的寫法:
矩陣ARm×nA \in \mathbb{R}^{m×n}與向量xRnx \in \mathbb{R}^n的乘積爲向量y=AxRmy=Ax \in \mathbb{R}^m
行的形式:
來寫AAxA,Axyi=aiTxy_i=a_i^Tx

y=Ax=[a1Ta2TamT]x=[a1Txa2TxamTx]y=Ax=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right]x=\left[\begin{matrix} — &a_1^Tx& — \\ — &a_2^Tx& — \\ &\vdots& \\ — &a_m^Tx& — \\ \end{matrix} \right]

列的形式:
來寫AAxA,Ax

y=Ax=[a1a2an][x1x1x1]=[a1]x1+[a2]x2++[an]xny=Ax=\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right]\left[\begin{matrix} x_1\\x_1\\ \vdots \\x_1 \end{matrix} \right]=[a_1]x_1+[a_2]x_2+\cdots+[a_n]x_n

左乘行向量的寫法:

ARm×nA \in \mathbb{R}^{m×n},xRmx \in \mathbb{R}^m,yRny \in \mathbb{R}^n,則yT=xTAy^T=x^TA

行的形式:

yT=xTA=xT[a1a2an]=[xTa1xTa2xTan]y^T=x^TA=x^T\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} x^Ta_1&x^Ta_2&\cdots&x^Ta_n\end{matrix} \right]

列的形式:

yT=xTA=[x1x2xn][a1Ta2TamT]y^T=x^TA=\left[\begin{matrix} x_1&x_2&\cdots&x_n \end{matrix} \right] \left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right]

=x1[a1T]+x2[a2T]++xn[anT]=x_1\left[\begin{matrix} — &a_1^T& — \end{matrix} \right]+x_2\left[\begin{matrix} — &a_2^T& — \end{matrix} \right]+\cdots+x_n\left[\begin{matrix} — &a_n^T& — \end{matrix} \right]

2.3、矩陣乘法

基於以上的知識,矩陣乘法C=ABC=AB有4種表示方式

A的行,B的列: 最常用的方式

C=AB=[a1Ta2TamT][b1b2ap]=[a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1]C=AB=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right] \left[\begin{matrix} |&|& &|\\b_{1}&b_{2}& \cdots &a_{p}\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\\a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\\ \vdots& \vdots&\ddots&\vdots\\a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\end{matrix} \right]

A的列,B的行:

C=AB=[a1a2ap][b1Tb2TbnT]=i=1naibiTC=AB= \left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{p}\\|&|& &|\end{matrix} \right] \left[\begin{matrix} — &b_1^T& — \\ — &b_2^T& — \\ &\vdots& \\ — &b_n^T& — \\ \end{matrix} \right]= \displaystyle \sum_{i=1}^na_{i}b_{i}^T

或者,可以看作是一系列的向量-矩陣乘積:
B以列向量表示:

Ci=AbiC_i=Ab_i

C=AB=A[b1b2bp]=[Ab1Ab2Abp]C=AB= A\left[\begin{matrix} |&|& &|\\b_{1}&b_{2}& \cdots &b_{p}\\|&|& &|\end{matrix} \right] =\left[\begin{matrix} |&|& &|\\Ab_{1}&Ab_{2}& \cdots &Ab_{p}\\|&|& &|\end{matrix} \right]

A以行向量表示:

CiT=aiTBC_i^T=a_i^TB

C=AB=[b1Tb2TbnT]B=[a1TBa2TBamTB]C=AB=\left[\begin{matrix} — &b_1^T& — \\ — &b_2^T& — \\ &\vdots& \\ — &b_n^T& — \\ \end{matrix} \right]B=\left[\begin{matrix} — &a_1^TB& — \\ — &a_2^TB& — \\ &\vdots& \\ — &a_m^TB& — \\ \end{matrix} \right]

矩陣乘法的性質: (前面線性代數的本質更加形象)
·結合律 (AB)C=A(BC)(AB)C=A(BC)
·分配率A(B+C)=AB+ACA(B+C)=AB+AC
·沒有交換律!!

3、運算和性質

3.1、單位矩陣與對角矩陣

單位矩陣只有對角線位置是1,其餘都是0的矩陣

Iij={1i=j0ijI_{ij}=\left\{ \begin{matrix}1&i=j\\0& i \ne j \end{matrix} \right. (不等於號打出來有問題)

AI=A=IAAI=A=IA

對角矩陣只有對角不爲零

Dij={dii=j0ijD_{ij}=\left\{ \begin{matrix}d_i&i=j\\0& i \ne j \end{matrix} \right.

3.2、轉置

行列反轉,ARm×nA \in \mathbb{R}^{m×n}轉置爲ATRn×mA^T \in \mathbb{R}^{n×m}

其元素爲(AT)ij=Aji(A^T)_{ij}=A_{ji}

性質:(AT)T=A(A^T)^T=A(AB)T=BTAT(AB)^T=B^TA^T(A+B)T=AT+BT(A+B)^T=A^T+B^T

3.3、對稱矩陣

ARn×nA \in \mathbb{R}^{n×n},如果A=ATA=A^T,那就是對稱的,如果A=(AT)A=(-A^T)那就是反對稱的
任何矩陣A,A+ATA+A^T是對稱的,AATA-A^T是反對稱的,因此

A=12(A+AT)+12(AAT)A=\frac{1}{2}(A+A^T)+\frac{1}{2}(A-A^T)

通常將大小爲n的對稱矩陣幾何表示爲 Sn\mathbb {S}^n,因此ASnA\in\mathbb {S}^n表示A是n×nn×n對稱矩陣

3.4、跡

方陣ARnA\in\mathbb {R}^n的跡,記做tr(A)tr(A),可以省略括號 trAtrA,是矩陣的對角線元素之和:

trA=i=1nAiitrA=\displaystyle \sum_{i=1}^nA_{ii}

性質如下:

ARn×nA \in \mathbb{R}^{n×n}trA=trATtrA=trA^T
A,BRn×nA ,B\in \mathbb{R}^{n×n}tr(A+B)=trA+trBtr(A+B)=trA+trB
ARn×n,tRA \in \mathbb{R}^{n×n} ,t \in \mathbb{R}tr(tA)=ttrAtr(tA)=t trA
A,B,C都是方陣,trAB=trBAtrAB=trBA,trABC=trBCA=trCBAtrABC=trBCA=trCBA,方陣更多類推

3.5、範數

中間部分內容較多,後面再補上,

3.11、二次型和半正定矩陣

參見二次型的幾何意義-知乎

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章