前言
Courant-Fischer min-max theorem 是特徵值極爲重要的一個性質。 但是國內的各種教材資料包括博客上都很少提及。 我自己在科研中曾經用到過。 近期又碰到了另一個精彩的結論 韋爾定理(Wely theorem),有一個應用極大極小定理的簡潔美妙的證明。 因此, 這篇博文寫一下這個不容忽視的定理。
極大極小定理
首先,本定理針對的是Hermitian 矩陣, 即共軛對稱矩陣。 因爲只有共軛對稱矩陣的特徵值是確定爲實數值的, 其他矩陣很可能是複數值, 而複數值,也就不存在大小關係了。
Courant-Fisher min-max 定理
對於 n×n的矩陣 A, 有:
- λk=dim(U)=kminx∈U,∥x∥=1maxxHAx
- λk=dim(U)=n−k+1maxx∈U,∥x∥=1minxHAx
其中, λi 是 第 k 小的特徵值。
這個定理在兩年前接觸到的時候一頭霧水, 數院的國獎哥以此幫我證明了一個式子的時候更是驚爲天人。 核心原因是當時對子空間的概念的認知實在太過不足。 現在回頭看雖然仍覺得非常困難,但還是稍微精進了一些。
這個證明, 我參考了維基百科上的證明, 以下是對百科上過程的翻譯:
由於 A是共軛對稱矩陣, 所以根據共軛對稱矩陣的特徵分解的性質, 選定其特徵向量 {u1,…,un} 作爲一組正交基。 子空間與基相關知識
即, 這就是n維空間的 n 個基。
現在, 若有該 n維空間的一個子空間 U, 其維度爲 k, 和子空間 span(uk,…,un), 必定存在一個交集。 這一點其實可以這樣證明: 首先 U的維度是k, 而span(uk,…,un)的維度是 n−k+1。 也就是說, 兩者的維度之和 大於 n。因此, 必定存在一個非零的交集。(這一點其實可以這樣判斷: 如果維度之和剛好是n, 那可能兩個子空間剛好由一組正交基的兩部分擴展二成,是沒有交集的。但和爲n+1,如果沒有交集,就說明這個空間其實應該有n+1個正交基, 這是違背的。沒有想明白的讀者, 可以根據3維空間來想像: 3維空間的兩個二維子空間,必有交集。 而3維空間的1個二維子空間和1個一維子空間,是可以沒有交集的。)
因此, 假設 v 是交集上的一個元素, 即, 既屬於子空間 U 又屬於 子空間 span(uk,…,un)。 那麼, v∈span(uk,…,un), 因此有:
x=i=k∑nαiui
(由於 ∣∣x∣∣=1, 有 ∑i=knαi=1)
那麼,
xHAx=i=k∑nαi2uiHAui=i=k∑nλiαi2≥λi
即:
x∈U,∥x∥=1maxxHAx≥λi
對於所有子空間 U都成立。 即:
dim(U)=kminx∈U,∥x∥=1maxxHAx≥λi
這時候,我們再證另一半:
顯然, 空間 V=span{u1,…,uk} 作爲選擇的k維空間, 有:
xHAx≤λi
這個結論過於明顯,不做解釋了。
也就是說, x∈V,∥x∥=1maxxHAx≤λi,
而 V 顯然是 k維的子空間 U之一, 因此:
dim(U)=kminx∈U,∥x∥=1maxxHAx≤λi
所以有:
dim(U)=kminx∈U,∥x∥=1maxxHAx=λi
證畢。
經典應用: 韋爾定理 Wely theorem
對於兩個 n×n 的共軛對稱矩陣 A 和 B, 有:
λi(A)+λ1(B)≤λi(A+B)≤λi(A)+λn(B)。
顯然,這是一個極爲有用的定理。
先說下他的證明:
λi(A+B)=dim(V)=imaxx∈V,∥x∥=1minxH(A+B)x=dim(V)=imaxx∈V,∥x∥=1min(xHAx+xHBx)≥dim(V)=imax(x∈V,∥x∥=1minxHAx+x∈V,∥x∥=1minxHBx)≥dim(V)=imaxx∈V,∥x∥=1minxHAx+x∈V,∥x∥=1minxHBx=dim(V)=imaxx∈V,∥x∥=1minxHAx+λ1(B)=λi(A)+λ1(B)
非常簡潔。
這個定理可以推出一些有用的結論:
- 可以確定兩個共軛對稱矩陣和 的 特徵值的 範圍。
- 一個共軛對稱矩陣 加上一個正定共軛對稱矩陣, 特徵值必增大。