第五章 特徵值的估計及對稱矩陣的極性
注:
1.本章討論的是"
方陣“的特徵值。
2.複數域上的方陣
An∗n特徵值個數=階數n。
一、特徵值的估計
- 原因/背景:
1)大矩陣特徵值的計算困難;
2)大量應用中,不需要精確計算特徵值,只需估測出其範圍即可。
1.1. 特徵值的界
-
特徵值虛部的上界估計:
1)∣Im(λ)∣≤M2n(n−1),
其中,M=max21∣ars−asr∣,考察了矩陣的對稱程度。
2)∣Im(λ)∣≤21∣∣A−AH∣∣m無窮
[在估計特徵值虛部的上界時,(1)比(2)結果更精準。]
-
特徵值實部的上界估計:
-∣Re(λ)∣≤21∣∣A+AH∣∣m無窮
-∣λ∣≤ρ(A)∣≤∣A∣∣m無窮
以上 得到以下推論: |
1. 實對稱矩陣的特徵值都是實數。 |
2. Hermite矩陣的特徵值都是實數。A=AH |
3. 反Hermite矩陣的特徵值都是零或虛數。A=−AH |
- 特徵值的模的積的上下界估計:
1)矩陣A滿足按行嚴格對角佔優的特點,有:
0<∏r=1nmr≤∣detA∣=∏r=1n∣λr(A)∣≤∏r=1nMr.
等號成立:ars=0(s>r)
2)矩陣A是一般方陣,有:
∣detA∣=∏r=1n∣λr(A)∣≤[∏s=1n(∑r=1n∣ars∣2)]1/2.
等號成立:列向量兩兩相交(ar,as)=0.
也即,特徵值的模的積≤矩陣(各列元素的2-範數之和)的乘積。
其中,
涉及的幾個概念: |
1. Rr(A):第r行,除對角元素arr外其他所有元素的模之和 |
2. Mr(A):第r行,對角元素arr與其右側所有元素的模之和 |
3. mr(A):第r行,對角元素arr與其右側所有元素的模之差 |
4. 按行嚴格對角佔優:第r行,對角元素arr的模 > Rr(A) |
5. 按行弱對角佔優:第r行,對角元素arr的模 ≥ Rr(A),且存在r0∈[1,n],使得ar0r0的模>Rr0(A) |
- 特徵值的模的平方和的上界估計:
∑r=1n∣λr∣≤∑r,s=1n∣ars∣2=∣∣A∣∣F2
等號成立:A爲正規矩陣,AHA=AAH.
也即,A的特徵值的模的平方和≤A的所有元素的模的平方和。
1.2. 蓋爾圓 Gerschgorin
- 原因/背景:
幾何的角度估計特徵值:
Gerschgorin提出用複平面的一組圓盤覆蓋矩陣的全體特徵值。
對矩陣A的任一特徵值λ,存在i,使得對矩陣A的第i行有: ∣λ−arr∣≤Ri(A),
也即,λ在以(arr,0)爲圓心,以Ri爲半徑的圓Gi內。
-蓋爾圓與特徵值的關係 |
1. 方陣A的所有特徵值都在它的n個蓋爾圓的並集內。 |
2. 蓋爾圓並集組成的每個連通部分,若是由k個蓋爾圓組成的,則此連通部分有k個特徵值。 |
- 特徵值的隔離
1- 原因:
連通的蓋爾圓使得無法判斷特徵值到底在哪一個內,希望能夠每個圓內有且只有一個特徵值。
2-做法:
調整矩陣A的蓋爾圓半徑,使各個Gi孤立、不相交。
對矩陣做相似變換,需要找到合適的對角矩陣D[D=diag(d1,d2,...dn)],使得:
ri=∑j=1,j=in[aij]djdi,
其中,B=DAD−1=(djdiaij)n∗n.
1.3. Ostrowski
- 原因/背景:
幾何的角度估計特徵值:
Ostrowski提出用複平面的一組卵形覆蓋矩陣的全體特徵值。
Ostrowski 1:
對矩陣A的任一特徵值λ,存在i,使得對矩陣A的第i行有:
∣λ−arr∣≤[Ri(A)]α[Ri(AT)]1−α,
其中,0≤α≤1.
由於 τασ1−α≤ατ+(1−α)σ,
幾個推論 |
1. [λ−arr]≤αRi(A)+(1−α)Ri(AT) |
2. … |
Ostrowski 2:
對矩陣A的任一特徵值λ,存在i和j,使得對矩陣A的第i、j兩行有:
Ωij(A)={z∣z∈C,∣z−aii∣∣z−ajj∣≤Ri(A)Rj(A)},
其中,i=j.
- 推論:
∣aii∣∣ajj∣>Ri(A)Rj(A),則detA≠0.
其中,i=j.
二、廣義特徵值問題
Ax=λBx,其中A爲n階實對稱矩陣,B爲n階實對稱正定矩陣。
λ稱作矩陣A相對於B的特徵值,非零解x稱作λ的特徵向量,(\vec x_1,\vec x_2,…,\vec x_n)構成一個完備的特徵向量系(正交)。
- B−1Ax=λx,其中B−1A不是對稱矩陣。
- Sy=λy,其中,S=G−1A(G−1)T爲對稱矩陣。由於B是實對稱正定矩陣,可以進行Cholesky分解成B=GGT9。
三、對稱矩陣特徵值的極性
3.1. 實對稱矩陣的Rayleigh商的極性
3.1.1 實對稱矩陣的Rayleigh商
R(x)=xTxxTAx,(x=0)
Rayleigh商的性質 |
1. R(x)是連續函數 |
2. R(x)是x的零次齊次函數 |
3. R(kx)=R(x)=c |
4. R(x)的最大/小值能夠在單位圓上取到. |
3.1.2 實對稱矩陣的極性
1.若已知:
矩陣A的特徵值由小到大排列爲:λ1<λ2<...<λn,對應的標準正交特徵向量係爲:L= {p1,p2,...,pn}。
minx=0R(x)=λ1,maxx=0R(x)=λn
且在單位球面∣∣x∣∣2=1上,p1、pn分別是R(x)的一個極小值點和極大值點:
R(p1)=λ1,R(pn)=λn.
即,函數R(x)的最小值爲最小特徵值,最大值爲最大特徵值。
在單位圓上,R(x)在x=p1和pn處取得極值。
- 推論:
L的子空間L0={pr,pr+1,...,pk}的極性:
— minx=0R(x)=λr,maxx=0R(x)=λk
2.若特徵向量未知,則A的第k個特徵值爲:
— λk=minvkmax{xTAx∣x∈Vk,∣∣x∣∣2=1}
3.1.3 實對稱矩陣的擾動
3.2. 廣義特徵值的極小極大原理
3.2.1 廣義Rayleigh商
R(x)=xTBxxTAx,(x=0)
3.2.2 廣義特徵值的極性
-
駐點:
x0是函數R(x)的駐點的充要條件: x0是Ax=λBx的屬於特徵值λ的特徵向量.
-
廣義特徵值的極性:
特徵值的極小極大原理:— λk=minvkmax(0=x∈Vk)R(x)
特徵值的極大極小原理:— λ(n−k+1)=maxvkmin(0=x∈Vk)R(x)
-
實對稱矩陣特徵值的極性:
— λk=minvkmax(0=x∈Vk)R(x)
— λ(n−k+1)=maxvkmin(0=x∈Vk)R(x)
四、矩陣的直積與應用
4.1. 直積的概念
矩陣的直積:A⊗B.
直積的性質 |
|
1. 交換律 |
A⊗B≠B⊗A |
2. 分配律 |
(A1+A2)⊗B=A1⊗B+A2⊗B |
3. 結合律 |
(A⊗B)⊗C=A⊗(B⊗C) |
4. 數乘 |
k(A⊗B)=(kA)⊗B=A⊗(kB) |
5. 直積的乘積等於乘積的直積 |
(A1⊗B1)(A2⊗B2)=(A1A2)⊗(B1B2) |
6. 可逆性 |
Am∗m,Bn∗n都是可逆矩陣,則(A⊗B)−1=A−1⊗B−1 |
7. 三角矩陣 |
Am∗m,Bn∗n都是三角矩陣,則(A⊗B)也是三角矩陣 |
8. 共軛轉置 |
(A⊗B)H=AH⊗BH |
9. 正交酉矩陣 |
Am∗m,Bn∗n都是正交酉矩陣,則(A⊗B)也是正交酉矩陣 |
10. 秩 |
rank(A⊗B)=(rankA)*(rankB) |
11. 相似 |
A∈Cm∗m,B∈Cn∗n,則(A⊗B)~(B⊗A) |
- 與二元多項式結合:
對f(x,y)=∑i=0l1∑j=0l2cijxiyj,以及矩陣Am∗m,Bn∗n定義m*n階矩陣f(A,B):
f(A,B)=∑i=0l1∑j=0l2cijAi⊗Bj.
f(A,B)的性質 |
|
1. 特徵值 |
1> A的特徵值{λ1,λ2,...λn},B的特徵值{μ1,μ2,...μn},則矩陣f(A,B)的全體特徵值爲f(λi,μj); 2> 矩陣(A⊗B)的全體特徵值爲λiμj. |
2.行列式det |
A∈Cm∗m,B∈Cn∗n,det(A⊗B)=detAn∗detBm |
3.跡tr |
A∈Cm∗m,B∈Cn∗n,tr(A⊗B)=(trA)∗(trB) |
4.2. 線性矩陣方程的可解性