相關數學知識補充
矩陣的秩
定義
矩陣A中不爲零的子式的最高階數,稱爲矩陣A的秩,記作r(A)。零矩陣的秩爲0。
性質
- 秩是一個正整數或0。
- 秩等於或小於矩陣的行數和列數。秩等於或小於矩陣的行數和列數。
- 當n×n矩陣A的秩等於n時,則稱A是非奇異矩陣,或稱A滿秩。
- 若r(Am×n)<min{m,n},則稱A是秩虧缺的。
- 若r(Am×n)=m(<n),則稱矩陣A具有滿行秩。
- 若r(Am×n)=n(<m),則稱矩陣A具有滿列秩。
- 任何矩陣A左乘滿列秩矩陣或者右乘滿行秩矩陣後,矩陣A的秩保持不變。
意義
「秩」是矩陣中所有行向量中極大線性代無關組的元素個數。
「秩」是圖像經過矩陣變換之後的空間維度。
正交矩陣(orthogonal matrix)
定義
如果AAT = E或ATA = E,則n階實矩陣A稱爲正交矩陣。
性質
若A是正交矩陣,則滿足:
- AT,A-1與A*也是正交矩陣(其中 A* 是 A的共軛轉置。);
- A的各行各列是單位向量且兩兩正交;
- (Ax,Ay)=(x,y) 其中x,y∈R;
- AT = A-1;
- 正交矩陣相似於對角矩陣。
SVD推導的相關引理
引理1
內容:假設A ϵ Rm×n, 則ATA與AAT的特徵值 (eigenvalue)非負。
證明:
假設λ 爲AT A的特徵值,x是它對應的特徵向量,即
ATAx=λx
由於ATA是 對稱的,故 λ 是一個實數,因此我們有:
0≦(Ax,Ax)=(Ax)T(Ax)=xTATAx=xTλx=λxTx
因爲xTx > 0,因此我們可以得到λ≧0 。
同理,我們可以知道AAT的特徵值也是非負的。
引理2
內容:假設A ϵ Rm×n, 則我們有r(A) = r(ATA) = r(AAT)。
證明:
要證明r(A) = r(ATA) = r(AAT),相當於證明Ax=0和ATAx=0有相同的解。
Ax=0 ⇒ ATAx=0
ATAx=0 ⇒ xTATAx=0 ⇒ (Ax)TAx=0 ⇒ Ax=0
由此,可以得到Ax=0 ⇔ ATAx=0
Ax=0和ATAx=0有相同的解,故A與ATA核相等,所以秩相等可證。
引理3
內容:假設A ϵ Rm×n, ATA與AAT有相同的特徵值。
證明:
假設λ 爲AT A的特徵值,x是它對應的特徵向量,即
ATAx=λx
則
ATAx=λx⇒AATAx=λAx⇒AATy=λy
故可證得ATA與AAT有相同的λ。
引理4
內容:如果兩個矩陣是彼此正交等價,那麼它們的奇異值相同。
證明:
假設A ,B ϵ Rm×n, 彼此正交等價,則存在正交矩陣U ϵ Rm×m, Vϵ Rn×n, s.t. A=UBV.
若A,B彼此正交相似,則存在正交矩陣P,使得 P-1BP=A
ATA = (UBV)TUBV = VTBTUTUBV = VTBTBV = V-1BTBV
故可得到 ATA 與BTB彼此正交相似,因此它們有相同的λ;
奇異值σ = λ, 故兩者的奇異值相同。
SVD推導
A = UΣVT
證明:
∵ ATA爲對稱矩陣(證:(ATA)T=AT(AT)T=ATA)
(對稱矩陣性質:若A爲對稱矩陣,必存在正交矩陣,將其化爲對角矩陣,且對角矩陣的對角元素即爲特徵值)
∴ ATA = XλX-1
其中λ=⎝⎜⎜⎛λ1λ2⋱λn⎠⎟⎟⎞
X-1ATAX = λ
用V來替換X, 得到 V-1ATAV = λ
∵矩陣V正交 ∴V-1=VT
故 VTATAX = λ = (Δ2000)
將V拆成V1和V2,其中V1 ϵ Rn×r,V2 ϵ Rn×n−r
則(V1V2)(ATA)(V_1,V_2) = (V1TATAV2TATA)(V_1,V_2) = (V1TATAV1V2TATAV1V1TATAV2V2TATAV2)= (Δ2000)
∴ V2TATAV1=0 ⇒ (AV2)TAV2=0 ⇒AV2=0
Δ2=V1TATAV1=(AV1)TAV1
設U1 ϵ Rn×r , U1 = AV1Δ-1
U1TU1=(Δ−1)TV1TATAV1Δ−1=Δ−1Δ2Δ−1=Er
這說明U1各列爲兩兩正交的單位向量(自身與自身內積爲1)
同理,U也可以寫成U = (U1,U2)
UTAV = (U1TU2T)A(V1,V2) = (U1TAV1U2TAV1U1TAV2U2TAV2) = (U1TUΔU2TUΔU1T(AV2)U2T(AV2)) = (Δ000)
因此,可以得到:
A=UUTAVVT=U(Δ000)VT
故SVD得證。
參考資料
實對稱矩陣的特徵值和特徵向量