数据挖掘day9-CS229-Linear Algebra Review and Reference

因为计划先看的凸优化,但是发现其中很多符号不认识(不同的机构使用的不一定一样)。过两天才看到这个线性代数综述,我觉得应该是我的顺序搞反了,所以,将这一篇的日期顺序排的靠前点。其实我更推荐看原文章或翻译:中文翻译,不过这里我会把公式都打出来,主要是联系一下Latax。
(未完待填坑)

1、基本概念和符号

方程组:
4x15x2=134x_1-5x_2=-13
2x1+3x2=9-2x_1+3x_2=9

可以写成线性代数的形式:

Ax=bAx=b 其中: A=[4513]A=\left[\begin{matrix} 4&-5\\ -1&3 \end{matrix} \right],b=[139]b=\left[\begin{matrix}-13\\ 9\end{matrix} \right]

1.1、基本符号

采用以下符号:
· ARm×nA \in \mathbb{R}^{m×n} ,表示一个m行n列的矩阵,并且矩阵A中的所有元素都是实数。
· xRnx \in \mathbb{R}^{n} ,表示一个含有n个元素的向量,通常,我们把n维向量看成是一个n行1列矩阵,即列向量。如果我们想表示一个行向量(1行n列矩阵),我们通常写作xTx^T,即x的转置。
· 向量的第i个元素写作xix_i

x=[x1x2xn]x=\left[\begin{matrix} x_1\\x_2\\ \vdots \\x_n \end{matrix} \right]

·采用aij(orAij,Ai,j,etc)a_{ij }(or A_{ij} , A_{i,j} , etc)表示A的iijj列元素

A=[a11a12a1na21a22a2nam1am2amn]A=\left[\begin{matrix} a_{11}&a_{12}& \cdots &a_{1n}\\a_{21}&a_{22}& \cdots &a_{2n}\\ \vdots& \vdots&\ddots&\vdots\\a_{m1}&a_{m2}& \cdots &a_{mn} \end{matrix} \right]

·采用aj(orA:,j)a_{j }(or A_{:,j} )表示A的jj列元素

A=[a1a2an]A=\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right]

·采用aiT(orAi,:)a_{i}^T(or A_{i,:} )表示A的ii行元素

A=[a1Ta2TamT]A=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right]

2、矩阵乘法

百度百科-矩阵乘法
矩阵ARm×nA \in \mathbb{R}^{m×n}BRn×PB \in \mathbb{R}^{n×P}的乘积:
C=ABRm×pC=AB\in \mathbb{R}^{m×p}
其元素为Cij=k=1nAikBkjC_{ij}= \displaystyle \sum_{k=1}^nA_{ik}B_{kj}

2.1、向量乘积

内积:
x,yRnx,y \in \mathbb{R}^n,的点积/内积为xTyx^Ty,是一个实数
xTyR=[x1x2xn][y1y2yn]=i=1nxiyix^Ty \in \mathbb{R}=\left[\begin{matrix} x_1&x_2&\cdots&x_n \end{matrix} \right] \left[\begin{matrix} y_1\\y_2\\ \vdots\\y_n \end{matrix} \right]= \displaystyle \sum_{i=1}^nx_{i}y_{i}

内积是矩阵乘法的特例,通常xTy=yTxx^Ty=y^Tx

外积:
xRm,yRnx \in \mathbb{R}^m,y \in \mathbb{R}^nxyTRm×nxy^T \in \mathbb{R}^{m×n}为向量的外积

xyTRm×n=[x1x2xn][y1y2yn]=[x1y1x1y2x1ynx2y1x2y2x2ynxmy1xmy2xmyn]xy^T \in \mathbb{R}^{m×n}=\left[\begin{matrix} x_1\\x_2\\ \vdots\\x_n \end{matrix} \right] \left[\begin{matrix} y_1&y_2& \cdots&y_n \end{matrix} \right]= \left[\begin{matrix} x_1y_1&x_1y_2& \cdots &x_1y_n\\x_2y_1&x_2y_2& \cdots &x_2y_n\\ \vdots& \vdots&\ddots&\vdots\\x_my_1&x_my_2& \cdots &x_my_n \end{matrix} \right]

外积写法的例子,1Rn1 \in \mathbb {R}^n是元素都为1的n维向量,ARm×nA \in \mathbb{R}^{m×n}是m行n列矩阵,每一列都是xRmx \in \mathbb{R}^m,A可以简洁的写作

A=[xxx]=[x1x1x1x2x2x2xmxmxm]=[x1x1x1][y1y2yn]=x1TA=\left[\begin{matrix} |&|& &|\\x&x& \cdots &x\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} x_1&x_1& \cdots &x_1\\x_2&x_2& \cdots &x_2\\ \vdots& \vdots&\ddots&\vdots\\x_m&x_m& \cdots &x_m\end{matrix} \right]=\left[\begin{matrix} x_1\\x_1\\ \vdots \\x_1 \end{matrix} \right]\left[\begin{matrix} y_1&y_2& \cdots&y_n \end{matrix} \right]=x1^T

2.2、矩阵-向量乘法

右乘列向量的写法:
矩阵ARm×nA \in \mathbb{R}^{m×n}与向量xRnx \in \mathbb{R}^n的乘积为向量y=AxRmy=Ax \in \mathbb{R}^m
行的形式:
来写AAxA,Axyi=aiTxy_i=a_i^Tx

y=Ax=[a1Ta2TamT]x=[a1Txa2TxamTx]y=Ax=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right]x=\left[\begin{matrix} — &a_1^Tx& — \\ — &a_2^Tx& — \\ &\vdots& \\ — &a_m^Tx& — \\ \end{matrix} \right]

列的形式:
来写AAxA,Ax

y=Ax=[a1a2an][x1x1x1]=[a1]x1+[a2]x2++[an]xny=Ax=\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right]\left[\begin{matrix} x_1\\x_1\\ \vdots \\x_1 \end{matrix} \right]=[a_1]x_1+[a_2]x_2+\cdots+[a_n]x_n

左乘行向量的写法:

ARm×nA \in \mathbb{R}^{m×n},xRmx \in \mathbb{R}^m,yRny \in \mathbb{R}^n,则yT=xTAy^T=x^TA

行的形式:

yT=xTA=xT[a1a2an]=[xTa1xTa2xTan]y^T=x^TA=x^T\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} x^Ta_1&x^Ta_2&\cdots&x^Ta_n\end{matrix} \right]

列的形式:

yT=xTA=[x1x2xn][a1Ta2TamT]y^T=x^TA=\left[\begin{matrix} x_1&x_2&\cdots&x_n \end{matrix} \right] \left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right]

=x1[a1T]+x2[a2T]++xn[anT]=x_1\left[\begin{matrix} — &a_1^T& — \end{matrix} \right]+x_2\left[\begin{matrix} — &a_2^T& — \end{matrix} \right]+\cdots+x_n\left[\begin{matrix} — &a_n^T& — \end{matrix} \right]

2.3、矩阵乘法

基于以上的知识,矩阵乘法C=ABC=AB有4种表示方式

A的行,B的列: 最常用的方式

C=AB=[a1Ta2TamT][b1b2ap]=[a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1]C=AB=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right] \left[\begin{matrix} |&|& &|\\b_{1}&b_{2}& \cdots &a_{p}\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\\a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\\ \vdots& \vdots&\ddots&\vdots\\a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\end{matrix} \right]

A的列,B的行:

C=AB=[a1a2ap][b1Tb2TbnT]=i=1naibiTC=AB= \left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{p}\\|&|& &|\end{matrix} \right] \left[\begin{matrix} — &b_1^T& — \\ — &b_2^T& — \\ &\vdots& \\ — &b_n^T& — \\ \end{matrix} \right]= \displaystyle \sum_{i=1}^na_{i}b_{i}^T

或者,可以看作是一系列的向量-矩阵乘积:
B以列向量表示:

Ci=AbiC_i=Ab_i

C=AB=A[b1b2bp]=[Ab1Ab2Abp]C=AB= A\left[\begin{matrix} |&|& &|\\b_{1}&b_{2}& \cdots &b_{p}\\|&|& &|\end{matrix} \right] =\left[\begin{matrix} |&|& &|\\Ab_{1}&Ab_{2}& \cdots &Ab_{p}\\|&|& &|\end{matrix} \right]

A以行向量表示:

CiT=aiTBC_i^T=a_i^TB

C=AB=[b1Tb2TbnT]B=[a1TBa2TBamTB]C=AB=\left[\begin{matrix} — &b_1^T& — \\ — &b_2^T& — \\ &\vdots& \\ — &b_n^T& — \\ \end{matrix} \right]B=\left[\begin{matrix} — &a_1^TB& — \\ — &a_2^TB& — \\ &\vdots& \\ — &a_m^TB& — \\ \end{matrix} \right]

矩阵乘法的性质: (前面线性代数的本质更加形象)
·结合律 (AB)C=A(BC)(AB)C=A(BC)
·分配率A(B+C)=AB+ACA(B+C)=AB+AC
·没有交换律!!

3、运算和性质

3.1、单位矩阵与对角矩阵

单位矩阵只有对角线位置是1,其余都是0的矩阵

Iij={1i=j0ijI_{ij}=\left\{ \begin{matrix}1&i=j\\0& i \ne j \end{matrix} \right. (不等于号打出来有问题)

AI=A=IAAI=A=IA

对角矩阵只有对角不为零

Dij={dii=j0ijD_{ij}=\left\{ \begin{matrix}d_i&i=j\\0& i \ne j \end{matrix} \right.

3.2、转置

行列反转,ARm×nA \in \mathbb{R}^{m×n}转置为ATRn×mA^T \in \mathbb{R}^{n×m}

其元素为(AT)ij=Aji(A^T)_{ij}=A_{ji}

性质:(AT)T=A(A^T)^T=A(AB)T=BTAT(AB)^T=B^TA^T(A+B)T=AT+BT(A+B)^T=A^T+B^T

3.3、对称矩阵

ARn×nA \in \mathbb{R}^{n×n},如果A=ATA=A^T,那就是对称的,如果A=(AT)A=(-A^T)那就是反对称的
任何矩阵A,A+ATA+A^T是对称的,AATA-A^T是反对称的,因此

A=12(A+AT)+12(AAT)A=\frac{1}{2}(A+A^T)+\frac{1}{2}(A-A^T)

通常将大小为n的对称矩阵几何表示为 Sn\mathbb {S}^n,因此ASnA\in\mathbb {S}^n表示A是n×nn×n对称矩阵

3.4、迹

方阵ARnA\in\mathbb {R}^n的迹,记做tr(A)tr(A),可以省略括号 trAtrA,是矩阵的对角线元素之和:

trA=i=1nAiitrA=\displaystyle \sum_{i=1}^nA_{ii}

性质如下:

ARn×nA \in \mathbb{R}^{n×n}trA=trATtrA=trA^T
A,BRn×nA ,B\in \mathbb{R}^{n×n}tr(A+B)=trA+trBtr(A+B)=trA+trB
ARn×n,tRA \in \mathbb{R}^{n×n} ,t \in \mathbb{R}tr(tA)=ttrAtr(tA)=t trA
A,B,C都是方阵,trAB=trBAtrAB=trBA,trABC=trBCA=trCBAtrABC=trBCA=trCBA,方阵更多类推

3.5、范数

中间部分内容较多,后面再补上,

3.11、二次型和半正定矩阵

参见二次型的几何意义-知乎

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章