本篇筆記源於《程序員的數學之線性代數》
定義與性質
一般而言,對於方陣A,滿足
Ap=λpp=o
的數λ和向量p分別稱爲特徵值和特徵向量。
幾何學意義
從幾何學意義上講,特徵向量乘上A之後,除了長度會有伸縮變化,方向將不會發生改變。這裏的長度變化倍率便是特徵值。用動態圖描述在2x2矩陣A的作用下,其兩個特徵向量的變化如圖所示:
性質
令λ,p爲方陣A的特徵值和特徵向量,則
- “A有0特徵值”等價於“A是奇異矩陣”(0特徵值就說明存在Ap=o,p不等於o,所以A的ker不爲零,p至少有一維的信息映射到相同的結果,這一維在新空間中就無用了)
- “A沒有0特徵值”等價於“A可逆”(從行列式角度看A對角化後的行列式等於A的行列式,A行列式不爲0於是A可逆)
- 對於α=0,αp也是A的特徵向量,對應的特徵值都是λ
- 對於特徵值λ,若另有向量q也是其特徵向量,那麼p+q也是A的特徵向量,對應特徵值爲λ
- p是αA的特徵向量,對應特徵值爲αλ
- p是A+αI的特徵向量,對應特徵值爲α+λ
- p是Ak的特徵向量,對應特徵值爲λk
- p是A−1的特徵向量(前提是A逆存在),對應的特徵值爲λ1
- S−1p是S−1AS的特徵向量,對應的特徵值爲λ
- 對角矩陣diag(a1,⋯,an)的特徵值爲a1,⋯,an,對應特徵向量爲e1,⋯,en
- 分塊對角矩陣各個塊矩陣的特徵向量補0之後就是D的特徵向量
最後一個性質具體描述如下,對
D=⎝⎛AOOOBOOOC⎠⎞
p是A特徵向量,q是B特徵向量,r是c特徵向量,則
⎝⎛poo⎠⎞,⎝⎛oqo⎠⎞,⎝⎛oor⎠⎞
是D的特徵向量。
重要性質:設λ1,⋯,λk是n x n矩陣A的特徵值,p1,⋯,pk是對應的特徵向量。若λ1,⋯,λk兩兩不同,則p1,⋯,pk兩兩線性無關。(不相等的特徵值對應的特徵向量線性無關)
這個性質的證明需要用反證法和歸納法,大致思路就是假設存在一組(c1,…,ck)=(0,…,0)使得p1,⋯,pk線性相關,則有
c1p1+⋯+ckpk=o
同時左乘A,有
c1Ap1+⋯+ckApk=o
即
λ1c1p1+⋯+λkckpk=o
第一個式子乘λk倍減去上式,消元消掉pk,得
(λ1−λk)c1p1+⋯+(λk−1−λk)ck−1pk−1=o
也就是
c1′p1+⋯+ck−1′pk−1=o
因爲特徵值兩兩不同,原始的c不全爲0,所以這裏的c’也不全爲0,所以就得到了和原式條件一模一樣的少一個變量的等式。
循環往復以此類推。。。
最後得到
c1′′′p1c1′′′=o=0
那隻能p爲o了,但是前提是p是特徵向量,所以矛盾。所以p1,⋯,pk只能線性無關了。
特徵值計算
計算特徵值就需要用到特徵方程,其實特徵方程並不是新東西,很簡單,給定義式移項就能得到
(λI−A)p=o
這就說明(λI−A)是個奇異陣,其行列式必爲0。這就建立了等式了。我們把
ϕA(λ)≡det(λI−A)
稱爲特徵多項式,而ϕA(λ)=0就稱爲特徵方程。通過解特徵方程,就能得出特徵值了。這裏的特徵值也會解得複數,也有其幾何意義,但是在此就不展開討論了。
筆記到這裏可能有一個疑問,相同的特徵值會不會造成什麼問題?答案是有可能造成一些問題,比如n維矩陣,如果有相同的特徵值,運氣不好的話線性無關的特徵向量可能最多隻能得到小於n個。關於這個現象在後續的筆記中將繼續詳細討論。