《矩陣論》學習筆記(五):第五章 特徵值的估計及對稱矩陣的極性

第五章 特徵值的估計及對稱矩陣的極性


注:
1.本章討論的是"方陣“的特徵值。
2.複數域上的方陣AnnA_{n*n}特徵值個數=階數n。

一、特徵值的估計

  • 原因/背景:
    1)大矩陣特徵值的計算困難;
    2)大量應用中,不需要精確計算特徵值,只需估測出其範圍即可。
特徵值的估計
1. 任一特徵值虛部的上界估計
2. 任一特徵值實部的上界估計
3. 所有特徵值的模的積的上下界估計
4. 所有特徵值的模的平方和的上界估計

1.1. 特徵值的界

  1. 特徵值虛部的上界估計:
    1)Im(λ)Mn(n1)2|Im(\lambda)|≤M\sqrt{\frac{n(n-1)}{2}}
    其中,M=max12arsasrM=max\frac{1}{2}|a_{rs}-a_{sr}|,考察了矩陣的對稱程度。
    2)Im(λ)12AAHm|Im(\lambda)|≤\frac{1}{2}||A-A^H||_{m無窮}
    [在估計特徵值虛部的上界時,(1)比(2)結果更精準。]

  2. 特徵值實部的上界估計:
    -Re(λ)12A+AHm|Re(\lambda)|≤\frac{1}{2}||A+A^H||_{m無窮}
    -λρ(A)Am|\lambda|≤\rho(A)|≤|A||_{m無窮}

以上 得到以下推論:
1. 實對稱矩陣的特徵值都是實數。
2. Hermite矩陣的特徵值都是實數。A=AHA=A^H
3. 反Hermite矩陣的特徵值都是零或虛數。A=AHA=-A^H
  1. 特徵值的模的積的上下界估計:
    1)矩陣A滿足按行嚴格對角佔優的特點,有:
    0<r=1nmrdetA=r=1nλr(A)r=1nMr0<\prod_{r=1}^n m_r≤|detA|=\prod_{r=1}^n|\lambda_r(A)|≤\prod_{r=1}^n M_r.
    等號成立:ars=0a_{rs}=0(s>r)
    2)矩陣A是一般方陣,有:
    detA=r=1nλr(A)[s=1n(r=1nars2)]1/2|detA|=\prod_{r=1}^n|\lambda_r(A)|≤[\prod_{s=1}^n(\sum_{r=1}^n |a_{rs}|^2)]^{1/2}.
    等號成立:列向量兩兩相交(ar,as)=0(a_r,a_s)=0.
    也即,特徵值的模的積≤矩陣(各列元素的2-範數之和)的乘積。
    其中,
涉及的幾個概念:
1. Rr(A)R_r(A):第r行,除對角元素arra_{rr}外其他所有元素的模之和
2. Mr(A)M_r(A):第r行,對角元素arra_{rr}與其右側所有元素的模之和
3. mr(A)m_r(A):第r行,對角元素arra_{rr}與其右側所有元素的模之差
4. 按行嚴格對角佔優:第r行,對角元素arra_{rr}的模 > Rr(A)R_r(A)
5. 按行弱對角佔優:第r行,對角元素arra_{rr}的模 ≥ Rr(A)R_r(A),且存在r0[1,n]r_0∈[1,n],使得ar0r0a_{r_0r_0}的模>Rr0(A)R_{r_0}(A)
  1. 特徵值的模的平方和的上界估計:
    r=1nλrr,s=1nars2=AF2\sum_{r=1}^n |\lambda_r|≤\sum_{r,s=1}^n |a_{rs}|^2=||A||^2_F
    等號成立:A爲正規矩陣,AHA=AAHA^HA=AA^H.
    也即,A的特徵值的模的平方和≤A的所有元素的模的平方和。

1.2. 蓋爾圓 Gerschgorin

  • 原因/背景:
    幾何的角度估計特徵值:
    Gerschgorin提出用複平面的一組圓盤覆蓋矩陣的全體特徵值。

對矩陣A的任一特徵值λ\lambda,存在i,使得對矩陣A的第i行有: λarrRi(A)|\lambda-a_{rr}|≤R_i(A)
也即,λ\lambda在以(arr,0a_{rr},0)爲圓心,以RiR_i爲半徑的圓GiG_i內。

-蓋爾圓與特徵值的關係
1. 方陣A的所有特徵值都在它的n個蓋爾圓的並集內。
2. 蓋爾圓並集組成的每個連通部分,若是由k個蓋爾圓組成的,則此連通部分有k個特徵值。
  • 特徵值的隔離
    1- 原因:
    連通的蓋爾圓使得無法判斷特徵值到底在哪一個內,希望能夠每個圓內有且只有一個特徵值。
    2-做法:
    調整矩陣A的蓋爾圓半徑,使各個GiG_i孤立、不相交。
    對矩陣做相似變換,需要找到合適的對角矩陣D[D=diag(d1,d2,...dn)diag(d_1,d_2,...d_n)],使得:
    ri=j=1,jin[aij]didjr_i=\sum_{j=1,j≠i}^n [a_{ij}]\frac{d_i}{d_j}
    其中,B=DAD1=(didjaij)nn^{-1}=(\frac{d_i}{d_j}a_{ij})_{n*n}.

1.3. Ostrowski

  • 原因/背景:
    幾何的角度估計特徵值:
    Ostrowski提出用複平面的一組卵形覆蓋矩陣的全體特徵值。

Ostrowski 1:

對矩陣A的任一特徵值λ\lambda,存在i,使得對矩陣A的第i行有:
λarr[Ri(A)]α[Ri(AT)]1α|\lambda-a_{rr}|≤[R_i(A)]^{\alpha}[R_i(A^T)]^{1-\alpha}
其中,0α10≤\alpha≤1.

由於 τασ1αατ+(1α)σ\tau^{\alpha}\sigma^{1-\alpha}≤{\alpha}\tau+(1-\alpha)\sigma

幾個推論
1. [λarr]αRi(A)+(1α)Ri(AT)[\lambda-a_{rr}]≤{\alpha}R_i(A)+(1-\alpha)R_i(A^T)
2. …

Ostrowski 2:

對矩陣A的任一特徵值λ\lambda,存在i和j,使得對矩陣A的第i、j兩行有:
Ωij(A)=\Omega_{ij}(A)={zzC,zaiizajjRi(A)Rj(A)z|z∈C,|z-a_{ii}||z-a_{jj}|≤R_i(A)R_j(A)},
其中,iji≠j.

  • 推論:
    aiiajj>Ri(A)Rj(A)|a_{ii}||a_{jj}|>R_i(A)R_j(A),則detA≠0.
    其中,iji≠j.

二、廣義特徵值問題

  • 原因/背景:
    在振動理論中,常碰到廣義特徵值問題的求解問題。

  • 廣義特徵值:

Ax=λBxA\vec x=\lambda B \vec x,其中A爲n階實對稱矩陣,B爲n階實對稱正定矩陣。
λ\lambda稱作矩陣A相對於B的特徵值,非零解x\vec x稱作λ\lambda的特徵向量,(\vec x_1,\vec x_2,…,\vec x_n)構成一個完備的特徵向量系(正交)。

  • 廣義特徵值的等價形式:
  1. B1Ax=λxB^{-1}A\vec x=\lambda \vec x,其中B1AB^{-1}A不是對稱矩陣。
  2. Sy=λyS\vec y=\lambda \vec y,其中,S=G1A(G1)TS=G^{-1}A(G^{-1})^T爲對稱矩陣。由於B是實對稱正定矩陣,可以進行Cholesky分解成B=GGT9B=GG^{^T9}

三、對稱矩陣特徵值的極性

3.1. 實對稱矩陣的Rayleigh商的極性

3.1.1 實對稱矩陣的Rayleigh商

R(x)=xTAxxTx,(x0)R( \vec x)=\frac{\vec x^TA\vec x}{\vec x^T\vec x},(x≠0)

Rayleigh商的性質
1. R(x)是連續函數
2. R(x)是x的零次齊次函數
3. R(kx)=R(x)=c
4. R(x)的最大/小值能夠在單位圓上取到.

3.1.2 實對稱矩陣的極性

1.若已知:
矩陣A的特徵值由小到大排列爲:λ1<λ2<...<λn\lambda_1<\lambda_2<...<\lambda_n,對應的標準正交特徵向量係爲:L= {p1,p2,...,pnp_1,p_2,...,p_n}。

  • 得到實對稱矩陣的極性:

minx0R(x)=λ1maxx0R(x)=λnmin_{x≠0}R(x)=\lambda_1,max_{x≠0}R(x)=\lambda_n
且在單位球面x2=1||x||_2=1上,p1pnp_1、p_n分別是R(x)的一個極小值點和極大值點:
R(p1)=λ1R(pn)=λn.R(p_1)=\lambda_1,R(p_n)=\lambda_n.
即,函數R(x)的最小值爲最小特徵值,最大值爲最大特徵值。
在單位圓上,R(x)在x=p1和pn處取得極值。

  • 推論:
    L的子空間L0=L_0={pr,pr+1,...,pkp_r,p_{r+1},...,p_k}的極性:
    minx0R(x)=λrmaxx0R(x)=λkmin_{x≠0}R(x)=\lambda_r,max_{x≠0}R(x)=\lambda_k

2.若特徵向量未知,則A的第k個特徵值爲:
λk=minvkmax\lambda_k=min_{v_k}max{xTAxxVkx2=1x^TAx|x∈V_k,||x||_2=1}

3.1.3 實對稱矩陣的擾動

3.2. 廣義特徵值的極小極大原理

3.2.1 廣義Rayleigh商

R(x)=xTAxxTBx,(x0)R( \vec x)=\frac{\vec x^TA\vec x}{\vec x^TB\vec x},(x≠0)

3.2.2 廣義特徵值的極性

  • 駐點
    x0x_0是函數R(x)的駐點的充要條件: x0x_0Ax=λBxAx=\lambda Bx的屬於特徵值λ\lambda的特徵向量.

  • 廣義特徵值的極性
    特徵值的極小極大原理:— λk=minvkmax(0xVk)R(x)\lambda_k=min_{v_k}max_{(0≠x∈V_k)}R(x)
    特徵值的極大極小原理:— λ(nk+1)=maxvkmin(0xVk)R(x)\lambda_(n-k+1)=max_{v_k}min_{(0≠x∈V_k)}R(x)

  • 實對稱矩陣特徵值的極性
    λk=minvkmax(0xVk)R(x)\lambda_k=min_{v_k}max_{(0≠x∈V_k)}R(x)
    λ(nk+1)=maxvkmin(0xVk)R(x)\lambda_(n-k+1)=max_{v_k}min_{(0≠x∈V_k)}R(x)

四、矩陣的直積與應用

4.1. 直積的概念

矩陣的直積:A⊗B.

直積的性質
1. 交換律 A⊗B≠B⊗A
2. 分配律 (A1+A2)⊗B=A1⊗B+A2⊗B
3. 結合律 (A⊗B)⊗C=A⊗(B⊗C)
4. 數乘 k(A⊗B)=(kA)⊗B=A⊗(kB)
5. 直積的乘積等於乘積的直積 (A1⊗B1)(A2⊗B2)=(A1A2)⊗(B1B2)
6. 可逆性 Amm,BnnA_{m*m},B_{n*n}都是可逆矩陣,則(A⊗B)1^{-1}=A1^{-1}⊗B1^{-1}
7. 三角矩陣 Amm,BnnA_{m*m},B_{n*n}都是三角矩陣,則(A⊗B)也是三角矩陣
8. 共軛轉置 (A⊗B)H^H=AH^H⊗BH^H
9. 正交酉矩陣 Amm,BnnA_{m*m},B_{n*n}都是正交酉矩陣,則(A⊗B)也是正交酉矩陣
10. 秩 rank(A⊗B)=(rankA)*(rankB)
11. 相似 ACmm,BCnnA∈C^{m*m},B∈C^{n*n},則(A⊗B)~(B⊗A)
  • 與二元多項式結合:
    f(x,y)=i=0l1j=0l2cijxiyjf(x,y)=\sum_{i=0}^{l_1}\sum_{j=0}^{l_2}c_{ij}x^iy^j,以及矩陣Amm,BnnA_{m*m},B_{n*n}定義m*n階矩陣f(A,B):
    f(A,B)=i=0l1j=0l2cijAiBjf(A,B)=\sum_{i=0}^{l_1}\sum_{j=0}^{l_2}c_{ij}A^i⊗B^j.
f(A,B)的性質
1. 特徵值 1> A的特徵值{λ1,λ2,...λn\lambda_1,\lambda_2,...\lambda_n},B的特徵值{μ1,μ2,...μn\mu_1,\mu_2,...\mu_n},則矩陣f(A,B)f(A,B)的全體特徵值爲f(λi,μj)f(\lambda_i,\mu_j);
2> 矩陣(A⊗B)的全體特徵值爲λiμj\lambda_i\mu_j.
2.行列式det ACmm,BCnn,det(AB)=detAndetBmA∈C^{m*m},B∈C^{n*n},det(A⊗B)=detA^n*detB^m
3.跡tr ACmm,BCnn,tr(AB)=(trA)(trB)A∈C^{m*m},B∈C^{n*n},tr(A⊗B)=(trA)*(trB)

4.2. 線性矩陣方程的可解性

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章