第五章特徵值的估計及對稱矩陣的極性

文章目錄

注：
1.本章討論的是"方陣“的特徵值。
2.複數域上的方陣

A_{n*n}

特徵值個數=階數n。

一、特徵值的估計

原因/背景：
1）大矩陣特徵值的計算困難；
2）大量應用中，不需要精確計算特徵值，只需估測出其範圍即可。

1.1. 特徵值的界

特徵值虛部的上界估計：
1） $|Im(\lambda)|≤M\sqrt{\frac{n(n-1)}{2}}$ ，
其中， $M=max\frac{1}{2}|a_{rs}-a_{sr}|$ ，考察了矩陣的對稱程度。
2） $|Im(\lambda)|≤\frac{1}{2}||A-A^H||_{m無窮}$
[在估計特徵值虛部的上界時，(1)比(2)結果更精準。]
特徵值實部的上界估計：
- $|Re(\lambda)|≤\frac{1}{2}||A+A^H||_{m無窮}$
- $|\lambda|≤\rho(A)|≤|A||_{m無窮}$

以上得到以下推論：
1. 實對稱矩陣的特徵值都是實數。
2. Hermite矩陣的特徵值都是實數。 $A=A^H$
3. 反Hermite矩陣的特徵值都是零或虛數。 $A=-A^H$

特徵值的模的積的上下界估計：
1）矩陣A滿足按行嚴格對角佔優的特點，有：
$0<\prod_{r=1}^n m_r≤|detA|=\prod_{r=1}^n|\lambda_r(A)|≤\prod_{r=1}^n M_r$ .
等號成立： $a_{rs}=0$ (s>r)
2）矩陣A是一般方陣，有：
$|detA|=\prod_{r=1}^n|\lambda_r(A)|≤[\prod_{s=1}^n(\sum_{r=1}^n |a_{rs}|^2)]^{1/2}$ .
等號成立：列向量兩兩相交 $(a_r,a_s)=0$ .
也即，特徵值的模的積≤矩陣(各列元素的2-範數之和)的乘積。
其中，

涉及的幾個概念：
1. $R_r(A)$ ：第r行，除對角元素 $a_{rr}$ 外其他所有元素的模之和
2. $M_r(A)$ ：第r行，對角元素 $a_{rr}$ 與其右側所有元素的模之和
3. $m_r(A)$ ：第r行，對角元素 $a_{rr}$ 與其右側所有元素的模之差
4. 按行嚴格對角佔優：第r行，對角元素 $a_{rr}$ 的模 > $R_r(A)$
5. 按行弱對角佔優：第r行，對角元素 $a_{rr}$ 的模 ≥ $R_r(A)$ ，且存在 $r_0∈[1,n]$ ，使得 $a_{r_0r_0}$ 的模> $R_{r_0}(A)$

特徵值的模的平方和的上界估計：
$\sum_{r=1}^n |\lambda_r|≤\sum_{r,s=1}^n |a_{rs}|^2=||A||^2_F$
等號成立：A爲正規矩陣， $A^HA=AA^H$ .
也即，A的特徵值的模的平方和≤A的所有元素的模的平方和。

1.2. 蓋爾圓 Gerschgorin

原因/背景：
幾何的角度估計特徵值：
Gerschgorin提出用複平面的一組圓盤覆蓋矩陣的全體特徵值。

對矩陣A的任一特徵值 $\lambda$ ，存在i，使得對矩陣A的第i行有： $|\lambda-a_{rr}|≤R_i(A)$ ，
也即， $\lambda$ 在以( $a_{rr},0$ )爲圓心，以 $R_i$ 爲半徑的圓 $G_i$ 內。

-蓋爾圓與特徵值的關係
1. 方陣A的所有特徵值都在它的n個蓋爾圓的並集內。
2. 蓋爾圓並集組成的每個連通部分，若是由k個蓋爾圓組成的，則此連通部分有k個特徵值。

特徵值的隔離
1- 原因：
連通的蓋爾圓使得無法判斷特徵值到底在哪一個內，希望能夠每個圓內有且只有一個特徵值。
2-做法：
調整矩陣A的蓋爾圓半徑，使各個 $G_i$ 孤立、不相交。
對矩陣做相似變換，需要找到合適的對角矩陣D[D= $diag(d_1,d_2,...d_n)$ ]，使得：
$r_i=\sum_{j=1,j≠i}^n [a_{ij}]\frac{d_i}{d_j}$ ，
其中，B=DAD $^{-1}=(\frac{d_i}{d_j}a_{ij})_{n*n}$ .

1.3. Ostrowski

原因/背景：
幾何的角度估計特徵值：
Ostrowski提出用複平面的一組卵形覆蓋矩陣的全體特徵值。

Ostrowski 1：

對矩陣A的任一特徵值 $\lambda$ ，存在i，使得對矩陣A的第i行有：
$|\lambda-a_{rr}|≤[R_i(A)]^{\alpha}[R_i(A^T)]^{1-\alpha}$ ，
其中， $0≤\alpha≤1$ .

由於 $\tau^{\alpha}\sigma^{1-\alpha}≤{\alpha}\tau+(1-\alpha)\sigma$ ，

幾個推論
1. $[\lambda-a_{rr}]≤{\alpha}R_i(A)+(1-\alpha)R_i(A^T)$
2. …

Ostrowski 2：

對矩陣A的任一特徵值 $\lambda$ ，存在i和j，使得對矩陣A的第i、j兩行有：
$\Omega_{ij}(A)=$ { $z|z∈C,|z-a_{ii}||z-a_{jj}|≤R_i(A)R_j(A)$ }，
其中， $i≠j$ .

推論：
$|a_{ii}||a_{jj}|>R_i(A)R_j(A)$ ，則detA≠0.
其中， $i≠j$ .

二、廣義特徵值問題

原因/背景：
在振動理論中，常碰到廣義特徵值問題的求解問題。
廣義特徵值：

$A\vec x=\lambda B \vec x$ ，其中A爲n階實對稱矩陣，B爲n階實對稱正定矩陣。
$\lambda$ 稱作矩陣A相對於B的特徵值，非零解 $\vec x$ 稱作 $\lambda$ 的特徵向量，(\vec x_1,\vec x_2,…,\vec x_n)構成一個完備的特徵向量系(正交)。

廣義特徵值的等價形式：

$B^{-1}A\vec x=\lambda \vec x$ ，其中 $B^{-1}A$ 不是對稱矩陣。
$S\vec y=\lambda \vec y$ ，其中， $S=G^{-1}A(G^{-1})^T$ 爲對稱矩陣。由於B是實對稱正定矩陣，可以進行Cholesky分解成 $B=GG^{^T9}$ 。

三、對稱矩陣特徵值的極性

3.1. 實對稱矩陣的Rayleigh商的極性

3.1.1 實對稱矩陣的Rayleigh商

$R( \vec x)=\frac{\vec x^TA\vec x}{\vec x^T\vec x},(x≠0)$

Rayleigh商的性質
1. R(x)是連續函數
2. R(x)是x的零次齊次函數
3. R(kx)=R(x)=c
4. R(x)的最大/小值能夠在單位圓上取到.

3.1.2 實對稱矩陣的極性

1.若已知：
矩陣A的特徵值由小到大排列爲： $\lambda_1<\lambda_2<...<\lambda_n$ ，對應的標準正交特徵向量係爲：L= { $p_1,p_2,...,p_n$ }。

得到實對稱矩陣的極性：

$min_{x≠0}R(x)=\lambda_1，max_{x≠0}R(x)=\lambda_n$
且在單位球面 $||x||_2=1$ 上， $p_1、p_n$ 分別是R(x)的一個極小值點和極大值點：
$R(p_1)=\lambda_1，R(p_n)=\lambda_n.$
即，函數R(x)的最小值爲最小特徵值，最大值爲最大特徵值。
在單位圓上，R(x)在x=p1和pn處取得極值。

推論：
L的子空間 $L_0=$ { $p_r,p_{r+1},...,p_k$ }的極性：
— $min_{x≠0}R(x)=\lambda_r，max_{x≠0}R(x)=\lambda_k$

2.若特徵向量未知，則A的第k個特徵值爲：
— $\lambda_k=min_{v_k}max$ { $x^TAx|x∈V_k，||x||_2=1$ }

3.1.3 實對稱矩陣的擾動

3.2. 廣義特徵值的極小極大原理

3.2.1 廣義Rayleigh商

$R( \vec x)=\frac{\vec x^TA\vec x}{\vec x^TB\vec x},(x≠0)$

3.2.2 廣義特徵值的極性

駐點：
$x_0$ 是函數R(x)的駐點的充要條件： $x_0$ 是 $Ax=\lambda Bx$ 的屬於特徵值 $\lambda$ 的特徵向量.
廣義特徵值的極性：
特徵值的極小極大原理：— $\lambda_k=min_{v_k}max_{(0≠x∈V_k)}R(x)$
特徵值的極大極小原理：— $\lambda_(n-k+1)=max_{v_k}min_{(0≠x∈V_k)}R(x)$
實對稱矩陣特徵值的極性：
— $\lambda_k=min_{v_k}max_{(0≠x∈V_k)}R(x)$
— $\lambda_(n-k+1)=max_{v_k}min_{(0≠x∈V_k)}R(x)$

四、矩陣的直積與應用

4.1. 直積的概念

矩陣的直積：A⊗B.

直積的性質
1. 交換律	A⊗B≠B⊗A
2. 分配律	(A1+A2)⊗B=A1⊗B+A2⊗B
3. 結合律	(A⊗B)⊗C=A⊗(B⊗C)
4. 數乘	k(A⊗B)=(kA)⊗B=A⊗(kB)
5. 直積的乘積等於乘積的直積	(A1⊗B1)(A2⊗B2)=(A1A2)⊗(B1B2)
6. 可逆性	$A_{mm},B_{nn}$ 都是可逆矩陣，則(A⊗B) $^{-1}$ =A $^{-1}$ ⊗B $^{-1}$
7. 三角矩陣	$A_{mm},B_{nn}$ 都是三角矩陣，則(A⊗B)也是三角矩陣
8. 共軛轉置	(A⊗B) $^H$ =A $^H$ ⊗B $^H$
9. 正交酉矩陣	$A_{mm},B_{nn}$ 都是正交酉矩陣，則(A⊗B)也是正交酉矩陣
10. 秩	rank(A⊗B)=(rankA)*(rankB)
11. 相似	$A∈C^{mm},B∈C^{nn}$ ，則(A⊗B)~(B⊗A)

與二元多項式結合：
對 $f(x,y)=\sum_{i=0}^{l_1}\sum_{j=0}^{l_2}c_{ij}x^iy^j$ ，以及矩陣 $A_{m*m},B_{n*n}$ 定義m*n階矩陣f(A,B)：
$f(A,B)=\sum_{i=0}^{l_1}\sum_{j=0}^{l_2}c_{ij}A^i⊗B^j$ .

f(A,B)的性質
1. 特徵值	1> A的特徵值{ $\lambda_1,\lambda_2,...\lambda_n$ },B的特徵值{ $\mu_1,\mu_2,...\mu_n$ },則矩陣 $f(A,B)$ 的全體特徵值爲 $f(\lambda_i,\mu_j)$ ; 2> 矩陣(A⊗B)的全體特徵值爲 $\lambda_i\mu_j$ .
2.行列式det	$A∈C^{mm},B∈C^{nn},det(A⊗B)=detA^n*detB^m$
3.跡tr	$A∈C^{mm},B∈C^{nn},tr(A⊗B)=(trA)*(trB)$

《矩陣論》學習筆記（五）：第五章特徵值的估計及對稱矩陣的極性

第五章特徵值的估計及對稱矩陣的極性

文章目錄

一、特徵值的估計

1.1. 特徵值的界

1.2. 蓋爾圓 Gerschgorin

1.3. Ostrowski

二、廣義特徵值問題

三、對稱矩陣特徵值的極性

3.1. 實對稱矩陣的Rayleigh商的極性

3.1.1 實對稱矩陣的Rayleigh商

3.1.2 實對稱矩陣的極性

3.1.3 實對稱矩陣的擾動

3.2. 廣義特徵值的極小極大原理

3.2.1 廣義Rayleigh商

3.2.2 廣義特徵值的極性

四、矩陣的直積與應用

4.1. 直積的概念

4.2. 線性矩陣方程的可解性

【簡寫Mybatis-02】註冊機的實現以及SqlSession處理

手繪二維碼

.NET藉助虛擬網卡實現一個簡單異地組網工具

《矩陣論》學習筆記（五）：第五章特徵值的估計及對稱矩陣的極性

深度學習學習筆記(一)：深度學習在圖像和視頻的應用

《矩陣論》學習筆記（四）：4.2 矩陣的QR分解

《矩陣論》學習筆記（四）：第四章矩陣分解

《矩陣論》學習筆記（四）-1：4.1 矩陣的三角分解

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

《矩陣論》學習筆記（五）：第五章 特徵值的估計及對稱矩陣的極性

第五章 特徵值的估計及對稱矩陣的極性

文章目錄

一、特徵值的估計

1.1. 特徵值的界

1.2. 蓋爾圓 Gerschgorin

1.3. Ostrowski

二、廣義特徵值問題

三、對稱矩陣特徵值的極性

3.1. 實對稱矩陣的Rayleigh商的極性

3.1.1 實對稱矩陣的Rayleigh商

3.1.2 實對稱矩陣的極性

3.1.3 實對稱矩陣的擾動

3.2. 廣義特徵值的極小極大原理

3.2.1 廣義Rayleigh商

3.2.2 廣義特徵值的極性

四、矩陣的直積與應用

4.1. 直積的概念

4.2. 線性矩陣方程的可解性

《矩陣論》學習筆記（五）：第五章特徵值的估計及對稱矩陣的極性

第五章特徵值的估計及對稱矩陣的極性