作者水平有限,歡迎大家提出文中錯誤
正交性
xTy=0
則稱x⊥y,此時∥x∥2+∥y∥2=∥x+y∥2,稱爲勾股定理或Pythagoras′ law
- 0⊥any vector
- 如果說子空間S與子空間T垂直,∀v∈S,∀w∈T,v⊥w
- 對於矩陣A,C(AT)⊥N(A),C(A)⊥N(AT)
標準正交矩陣
Q is a orthonormal matrix, only if
qiTqj={0, if i=j1, if i=j
QTQ=I
對於一般的正交矩陣上式得出了一個對角陣,對角元是各列向量長度平方
如果Q是方陣
QT=Q−1
即使Qm∗n不是方陣
Qn∗mTQm∗n=In∗n
同時不難得出Q總是列滿秩的。
比如4維的Adhemar matrix,矩陣中只有-1和1,但並不是所有維度的矩陣都有這種形式
21⎣⎢⎢⎡11111−11−111−1−11−1−11⎦⎥⎥⎤
投影矩陣
一維情況
首先考慮向一維子空間的投影,p是b投影后的像,
b=p+e,bTa=pTa+eTa,
由於e⊥a,所以eTa=0,所以有bTa=pTa,
又因爲a與p同向,pTa=∥p∥∥a∥,所以aTaaTb=∥a∥∥p∥,
所以矩陣aTaaaT是一個投影算子,也可以看出p是子空間中距離b最近的像
向多維情況拓展,假設投影矩陣P可以將向量投影到A的列空間C(A)。
最小二乘法
在向多維情況拓展之前,首先說一下最小二乘法
考慮一個線性方程組Ax=b,b∈/C(A),此方程組一定是無解的,但是可以找到方程最近的一個解,通過把b投影到C(A)。
設此像爲p,方程組變爲Ax^=p,
Ax^是距離b最近的C(A)中的像,那麼誤差向量e=b−Ax^一定垂直於C(A)。
所以有AT(b−Ax^)=0。(特別一提e∈N(A))
則ATAx^=ATb
此時如果ATA是奇異的(明顯是方陣,而且是對稱矩陣),推導便走到了盡頭。所以下面論證ATA的可逆性。
若Ax=0,那麼ATAx=0,則
N(A)⊆N(ATA)
若ATAx=0,則xTATAx=0,則(Ax)TAx=0,則Ax=0,則
N(ATA)⊆N(A)
綜上所述,N(ATA)=N(A),rank ATA=rank A。
換言之,只有當A行滿秩或列滿秩的時候,ATA纔是可逆的。
回到投影矩陣
上一節已經知道只有A行滿秩或列滿秩的時候,(ATA)−1才存在, 那麼我們就假設A毫無冗餘地描述了其列空間,於是我們立馬可得
x^=(ATA)−1ATb
Ax^=A(ATA)−1ATb
p=A(ATA)−1ATb
至此,投影矩陣P已經得出
P=A(ATA)−1AT
可見此矩陣與一維情況有相似之處,當A是一個向量的時候,矩陣會退化爲其一維形式
如果A是一個標準正交的矩陣,記作Q,則
P=QQT
投影矩陣的若干性質
- 不難證明,P是對稱矩陣
- Pn=P,可以輕鬆證明,不再贅述
- ∀ v∈C(A),Pv=v
- 如果A可逆,P=I
再述最小二乘法
假設有一些數據構成了向量bmeasurement,理想條件下,bmeasurement在矩陣方程中是有解的,但是由於測量過程中噪聲的存在,bmeasurement偏離了真值,造成了Ax=bmeasurement無解,但是正如上文所說,可以將bmeasurement投影到C(A)中,使得方程可解,即擬合。其實擬合的數據點足夠多可以消除噪聲的影響,得到現有數據對應的最可能解。
在R2中討論
假設解爲y=ax+c,
⎣⎢⎢⎢⎡x1x2⋮xn11⋮1⎦⎥⎥⎥⎤[ac]=⎣⎢⎢⎢⎡y1⋮y2yn⎦⎥⎥⎥⎤
此爲Ax=bmeasurement
方程ATAx^=ATb的解爲
[a^c^]
ATA=⎣⎢⎡i=1∑nxi2i=1∑nxii=1∑nxin⎦⎥⎤
ATb=⎣⎢⎡i=1∑nxiyii=1∑nyi⎦⎥⎤
解爲:
a^=ni=1∑nxi2−(i=1∑nxi)2ni=1∑nxiyi−i=1∑nxii=1∑nyi,c^=yˉ−a^xˉ
以上即爲高中數學的線性迴歸方程
而上述方法可以達到什麼最優呢?根據投影的幾何意義,投影是爲了∥b−p∥最小
在二維的最小二乘法中,∥e∥2=i=1∑n[yi−(a^xˉ+c^)]2
∇e=0是我們需要求的狀態,則
∂a^e=0, ∂c^e=0
這個微分方程的解和上式一樣
如果A是一個標準正交的矩陣,記作Q,則方程ATAx^=ATb化爲
x^=QTb
其意義是在標準正交基[q1…qn]下,向量b的第i個座標爲x^=qiTb
Gram-Schmidt正交化
通過Gram-Schmidt正交化,可以根據A找到一組C(A)的標準正交基
看一個R3的例子
Q=[q1…qn]
首先
q1=∥a1∥1a1
對於q2
a2在a1上的投影向量等於a1Ta1a1a1Ta2,則
e1=(I−q1Tq1q1q1T)a2
或者
e1=a2−(q1Ta2)q1
而e1∥q2,所以
q2=∥e1∥1e1
對於q3,需要先構造矩陣
B=[q1q2]
a3在C(B)上的投影爲B(BTB)−1BTa3,則
e2=(I−B(BTB)−1BT)a3
或者
e2=a3−(q1q1T+q2q2T)a3
e2=a3−(q1Ta3)q1+(q2Ta3)q2
q3=∥e2∥1e2
推廣到任意維空間,第i個向量的正交化
ei−1=ai−j=1∑i−1(qjTai)qj, qi=∥ei−1∥1ei−1
注意這裏公式似乎和一些教材上的有所不同,是因爲這些教材上沒有在生成了正交基後立即對其標準化,導致BTB=I,而是一個對角陣。導致了每一項下係數不爲1。
A=QR
如果是消元法的矩陣形式是A=LU
那麼Gram-Schmidt正交化的矩陣形式就是A=QR
[a1a2⋯am]=[q1q2⋯qm]⎣⎢⎢⎢⎡a1Tq1a1Tq2⋮a1Tqma2Tq1a2Tq2⋮a2Tqm⋯⋯⋱⋯amTq1amTq2⋮amTqm⎦⎥⎥⎥⎤
其中對角線以下的元素全爲0,R 是一個上三角矩陣
[a1a2⋯am]=[q1q2⋯qm]⎣⎢⎢⎢⎡a1Tq1a2Tq1a2Tq2⋯⋯⋱amTq1amTq2⋮amTqm⎦⎥⎥⎥⎤