相关数学知识补充
矩阵的秩
定义
矩阵A中不为零的子式的最高阶数,称为矩阵A的秩,记作r(A)。零矩阵的秩为0。
性质
- 秩是一个正整数或0。
- 秩等于或小于矩阵的行数和列数。秩等于或小于矩阵的行数和列数。
- 当n×n矩阵A的秩等于n时,则称A是非奇异矩阵,或称A满秩。
- 若r(Am×n)<min{m,n},则称A是秩亏缺的。
- 若r(Am×n)=m(<n),则称矩阵A具有满行秩。
- 若r(Am×n)=n(<m),则称矩阵A具有满列秩。
- 任何矩阵A左乘满列秩矩阵或者右乘满行秩矩阵后,矩阵A的秩保持不变。
意义
「秩」是矩阵中所有行向量中极大线性代无关组的元素个数。
「秩」是图像经过矩阵变换之后的空间维度。
正交矩阵(orthogonal matrix)
定义
如果AAT = E或ATA = E,则n阶实矩阵A称为正交矩阵。
性质
若A是正交矩阵,则满足:
- AT,A-1与A*也是正交矩阵(其中 A* 是 A的共轭转置。);
- A的各行各列是单位向量且两两正交;
- (Ax,Ay)=(x,y) 其中x,y∈R;
- AT = A-1;
- 正交矩阵相似于对角矩阵。
SVD推导的相关引理
引理1
内容:假设A ϵ Rm×n, 则ATA与AAT的特征值 (eigenvalue)非负。
证明:
假设λ 为AT A的特征值,x是它对应的特征向量,即
ATAx=λx
由于ATA是 对称的,故 λ 是一个实数,因此我们有:
0≦(Ax,Ax)=(Ax)T(Ax)=xTATAx=xTλx=λxTx
因为xTx > 0,因此我们可以得到λ≧0 。
同理,我们可以知道AAT的特征值也是非负的。
引理2
内容:假设A ϵ Rm×n, 则我们有r(A) = r(ATA) = r(AAT)。
证明:
要证明r(A) = r(ATA) = r(AAT),相当于证明Ax=0和ATAx=0有相同的解。
Ax=0 ⇒ ATAx=0
ATAx=0 ⇒ xTATAx=0 ⇒ (Ax)TAx=0 ⇒ Ax=0
由此,可以得到Ax=0 ⇔ ATAx=0
Ax=0和ATAx=0有相同的解,故A与ATA核相等,所以秩相等可证。
引理3
内容:假设A ϵ Rm×n, ATA与AAT有相同的特征值。
证明:
假设λ 为AT A的特征值,x是它对应的特征向量,即
ATAx=λx
则
ATAx=λx⇒AATAx=λAx⇒AATy=λy
故可证得ATA与AAT有相同的λ。
引理4
内容:如果两个矩阵是彼此正交等价,那么它们的奇异值相同。
证明:
假设A ,B ϵ Rm×n, 彼此正交等价,则存在正交矩阵U ϵ Rm×m, Vϵ Rn×n, s.t. A=UBV.
若A,B彼此正交相似,则存在正交矩阵P,使得 P-1BP=A
ATA = (UBV)TUBV = VTBTUTUBV = VTBTBV = V-1BTBV
故可得到 ATA 与BTB彼此正交相似,因此它们有相同的λ;
奇异值σ = λ, 故两者的奇异值相同。
SVD推导
A = UΣVT
证明:
∵ ATA为对称矩阵(证:(ATA)T=AT(AT)T=ATA)
(对称矩阵性质:若A为对称矩阵,必存在正交矩阵,将其化为对角矩阵,且对角矩阵的对角元素即为特征值)
∴ ATA = XλX-1
其中λ=⎝⎜⎜⎛λ1λ2⋱λn⎠⎟⎟⎞
X-1ATAX = λ
用V来替换X, 得到 V-1ATAV = λ
∵矩阵V正交 ∴V-1=VT
故 VTATAX = λ = (Δ2000)
将V拆成V1和V2,其中V1 ϵ Rn×r,V2 ϵ Rn×n−r
则(V1V2)(ATA)(V_1,V_2) = (V1TATAV2TATA)(V_1,V_2) = (V1TATAV1V2TATAV1V1TATAV2V2TATAV2)= (Δ2000)
∴ V2TATAV1=0 ⇒ (AV2)TAV2=0 ⇒AV2=0
Δ2=V1TATAV1=(AV1)TAV1
设U1 ϵ Rn×r , U1 = AV1Δ-1
U1TU1=(Δ−1)TV1TATAV1Δ−1=Δ−1Δ2Δ−1=Er
这说明U1各列为两两正交的单位向量(自身与自身内积为1)
同理,U也可以写成U = (U1,U2)
UTAV = (U1TU2T)A(V1,V2) = (U1TAV1U2TAV1U1TAV2U2TAV2) = (U1TUΔU2TUΔU1T(AV2)U2T(AV2)) = (Δ000)
因此,可以得到:
A=UUTAVVT=U(Δ000)VT
故SVD得证。
参考资料
实对称矩阵的特征值和特征向量