(一)矩陣
引例SVD
什麼是SVD?
奇異值分解(Singular Value Decomposition)是一種重要的矩陣分解方法,可以看作對稱方陣在任意矩陣上的推廣。
與特徵值、特徵向量概念相對應:
- ∑ 對角線上的元素稱爲矩陣A的奇異值
- U 的第i列稱爲A的關於σi的左奇異向量
- V 的第i列稱爲A的關於σi的右奇異向量
舉例
基礎概念
定義
線性代數定義:方陣行列式
- 1階方陣行列式是該元素本身
- n階方陣行列式等於它任一行/列各元素與其對應的代數餘子式乘積之和
代數餘子式
- 餘子式
在一個n階行列式A中,把(i,j)元素aij所在的第i行和第j列劃去後,留下的n-1階方陣的行列式叫做元素aij的餘子式,記作Mij
- 代數餘子式
代數餘子式Aij = (−1)i+jMij
伴隨矩陣
對於n×n方陣的任意元素aij都有各自的代數餘子式Aij = (−1)i+jMij,
構造n×n的方陣A∗:
A∗是A的伴隨矩陣
Aij位於A∗的第j行第i列
方陣的逆
A⋅A∗=∣A∣⋅I
推導過程如下:
範德蒙行列式
證明範德蒙行列式,使用數學歸納法
矩陣的乘法/狀態轉移矩陣
矩陣乘法
A爲m×s階矩陣,B爲s×n階矩陣,那麼,C=A×B階矩陣是m×n階矩陣,其中
矩陣和向量乘法
A爲m×n階矩陣,B爲n×1階矩陣,則Ax爲m×1列向量,記爲y=A⋅x
由於n維列向量和n維空間的點一一對應,上式也是從n維空間的點到m維空間點的線性變換(旋轉、平移)。
特殊的,若m=n,Ax完成的是n維空間內的線性變換。
應用:機械手臂移動
狀態轉移矩陣
-
狀態轉義概率
某隨機過程,狀態有n個,用1—n表示。記在當前時刻t時位於i狀態,再t+1時刻位於j狀態的概率爲P(i,j)= P(j | i),即狀態轉移概率只依賴於前一個狀態。
-
概率轉移矩陣
第n+1代中處於第j個階層的概率爲:
此式中矩陣P爲(條件)概率轉移矩陣。第i行元素表示,在上一個狀態爲i時的分佈概率,即:每一行元素和爲1。
-
平穩分佈
轉移概率矩陣性質是初始概率不同,經過若干次迭代,最終穩定收斂在某個分佈上,稱爲平穩分佈,這個性質不是初始分佈的性質。
以下兩種寫法等價:
如果概率分佈πP=π,說明:
(1)該多項分佈是狀態轉移矩陣P的平穩分佈;
(2)線性方程xP = x的非負解爲π,而Pn唯一,因此π是線性方程xP = x的唯一非負解
矩陣和向量組
矩陣的秩
設在矩陣A中有一個不等於零的r階子式D,且所有r+1階子式(若存在)爲0,那麼D爲矩陣A的最高階非零子式,r稱爲矩陣A的秩,記爲R(A)=r。
- n×n的可逆矩陣,秩爲n
- 可逆矩陣又稱滿秩矩陣
- 矩陣的秩等於它行(列)向量組的秩
秩和線性方程組解的關係
對於n元線性方程組Ax=b
- 無解的充要條件是R(A)<R(A,b)
- 有唯一解的充要條件是R(A)=R(A,b)=n
- 有無限多解的充要條件是R(A)=R(A,b)<n
推論
- Ax=0 有非零解的充要條件是R(A)<n
- Ax=b 有解的充要條件是R(A)=R(A,b)
向量組等價
- 什麼是向量組等價
向量b能由向量組A:a1,a2,…am線性表出的充要條件是矩陣A=(a1,a2,…am)的秩等於矩陣B=(a1,a2,…am,b)的秩
設有兩個向量組A:a1,a2,…am和B:b1,b2,…bn,若向量組A和向量組B能夠相互表出,則稱向量組A和向量組B等價
- 係數矩陣
將向量組A和B所構成的矩陣依次記作A = (a1,a2,…am)和 B = (b1,b2,…bn),B組能由A組線性表示,即對每個向量bj,存在k1j,k2j,…kmj,使得
bj=k1ja1+k2ja2+...kmjam=(a1a2⋯am)⎝⎜⎜⎜⎛k1jk2j⋮kmj⎠⎟⎟⎟⎞
從而得到稀疏矩陣
(b1b2⋯bm)=(a1a2⋯am)⎝⎜⎜⎜⎛k11k21⋮km1k12k22⋮km2⋯⋯⋱⋯k1nk2n⋮kmn⎠⎟⎟⎟⎞
- 重認識 C=AB
若C=AB,則矩陣C的列向量能由A的列向量線性表示,B即爲這一表示的係數矩陣;矩陣C的行向量能由B的行向量線性表示,A即爲這一表示的係數矩陣。
向量組B:b1,b2,…bn能由向量組A:a1,a2,…am線性表示的充要條件是矩陣A=(a1,a2,…am)的秩等於矩陣(A,B)=(a1,a2,…am,b1,b2,…bn)的秩,即爲R(A)=R(A,B)。
- 正交陣
若n階矩陣滿足ATA=1,則A爲正交矩陣,簡稱正交陣。
充要條件:A的行(列)向量都是單位向量,且兩兩正交。
正交變換:A是正交陣,x爲向量,則A⋅x稱爲正交變換。正交變換不改變向量長度
(二)特徵值和特徵向量
特徵向量
- 定義:
A是n階矩陣,若λ和n維非0列向量x滿足Ax=λx,那麼λ稱爲A的特徵值,x稱爲A的對於特徵值λ的特徵向量。
- 求解:
由定義得(A−λI)x=0,令關於λ的多項式∣A−λI∣爲0,方程∣A−λI∣=0的根爲A的特徵值,將λ0代入方程組(A−λI)x=0,求得到的非零解,即λ0對應的特徵向量。
- 性質:
設n階矩陣A=(aij)的特徵值爲λ1,λ2,...λn則
(1)λ1+λ2+...+λn=a11+a22+...+ann
(2)λ1λ2...λn=∣A∣
- trace/矩陣的跡:
矩陣A主行列式的元素和
- 不同特徵值對應的特徵向量:
設λ1,λ2,...λn是方陣A的m個特徵值,p1,p2,...pm是依次與之對應的特徵向量,若λ1,λ2,...λn各不相等,則p1,p2,...pm線性無關。
不同特徵值對應的特徵向量,線性無關
- 引理:
實對稱矩陣的特徵值是實數。
設複數λ爲對稱陣A的特徵值,復向量x爲對應的特徵向量,即Ax=λx(x=0)
用λ表示λ的共軛複數,x表示x的共軛復向量,而A是實矩陣,則有A=A,證明如下:
Ax=Ax=Ax=λx=λx
因爲xT(Ax)=xTλx=λxTx
xT(Ax)=(xTA)x=(Ax)Tx=(λx)Tx=λxTx
從而
λxTx=λxTx⟹(λ−λ)xTx=0
而
所以
λ−λ=0⟹λ=λ
對稱陣、正交陣、正定陣
對稱陣
- 實對稱陣的特徵向量可以取實向量
- 實對稱陣不同特徵值的特徵向量正交
證明:令實對稱矩陣爲A,其兩個不同的特徵值λ1λ2對應的特徵向量分別是μ1μ2
{Aμ1=λ1μ1Aμ2=λ2μ2⟹μ1TAμ2=μ1Tλμ2
(ATμ1)Tμ2=λ2μ1Tμ2⟹(Aμ1)Tμ2=λ2μ1Tμ2
⟹(λ1μ1)Tμ2=λ2μ1Tμ2
⟹λ1μ1Tμ2=λ2μ1Tμ2
λ1=λ2μ1Tμ2=0
正交陣
A爲n階對稱陣,則必有正交陣P,使得P−1AP=PTAP=Λ
Λ是以A的n個特徵值爲對角元的對角陣
此變換稱爲合同變換,A和Λ互爲合同矩陣
正定陣
(1)定義:對於n階方陣A,若任意n階向量x,都有xTAx>0,則稱A是正定陣。
若條件變成xTAx大於等於0,則A稱作半正定矩陣
(2)判定:
對稱陣A爲正定陣等價A的特徵值都爲正等價A的順序主子式大於0
n階半正定陣的集合爲凸錐。
數據白化
計算觀測數據x的n×n的對稱陣x×xT的特徵值和特徵向量,用特徵值形成對角陣D,特徵向量形成正交陣U,則:x×xT=UTDU
令x~=UTD−0.5U⋅x
正交基
在n維歐式空間中,由n個非零向量組成的正交向量組稱爲正交基
QR分解/LFM
QR分解
對於m×n列滿秩矩陣A,必有Am×n=Qm×n⋅Rm×n,其中Q是列正交矩陣,R爲非奇異上三角矩陣,當要求R的對角線元素爲正時,該分解唯一,是QR分解,可用於求解矩陣A的特徵值,A的逆等問題。
計算n階方陣A的特徵值:
A=Q⋅R⟹A1=QTAQ=R⋅Q
......
Ak=Qk⋅Rk⟹Ak+1=Rk⋅Qk
......
Ak→diag{λ1,λ2,...,λn}
LFM
LatentFactorModel
對於K個隱變量,得Am×n=Um×k⋅Vn×kT
目標函數:
J(U,V;A)=i=1∑mj=1∑n(aij−r=1∑kuir⋅vjr)2+λ(i=1∑mr=1∑kuir2+j=1∑mr=1∑kujr2)
梯度:
(三)矩陣求導
向量對向量求導
線性迴歸中直接使用下式
∂x∂Ax=AT,∂xT∂Ax=A,∂x∂(xTA)=A
推導如下:
標量對向量求導
A爲n×n的矩陣,x爲n×1的列向量,記y=xT⋅A⋅x
∂x∂y=∂x∂(xT⋅A⋅x)=(AT+A)⋅x
若A爲對稱陣,則有∂x∂(xT⋅A⋅x)=2A⋅x
推導如下:
標量對矩陣求導
A爲 n×n的矩陣, ∣A∣爲 A的行列式, ∂A∂∣A∣=(A∗)T=∣A∣⋅(A−1)T,證明如下:
矩陣乘法詳解+例題