前言
在許多實際問題中,所產生的矩陣往往都是對稱矩陣,比如我們耳熟能詳的實對稱矩陣也是重要的研究對象。以下就從實對稱矩陣的角度出發,利用特徵值的極小極大原理
,從普通特徵值問題Ax=λx衍生到廣義特徵值問題Ax=λBx逐步討論其特徵值的性質。
【廣義特徵值問題】設A=(aij)∈Rn×n是n階實對稱
矩陣,B=(bij)∈Rn×n是n階實對稱正定
矩陣,使下式 Ax=λBx 有非零解向量x∈Rn,則稱λ是矩陣A相對於矩陣B的特徵值,且x是屬於λ的特徵向量。該問題常見於振動理論。
我們可以發現
- 當B=I時,該問題是
廣義特徵值問題
- 當B=I時,該問題是
普通特徵值問題
思路:如何利用極小極大原理求第k個特徵值及奇異值?
利用極大極小原理,我們先確定n階實對稱陣的最大最小特徵值,然後逐步求第2大和第2小特徵值進而歸納到求第k大和第k小特徵值。
本文就對稱矩陣特徵值的極性與直積做以梳理,完整定理證明請參考西工大的《矩陣論》[1]。
一、實對稱矩陣的瑞利商與廣義瑞利商性質
我們在討論實對稱矩陣的特徵值時,往往會通過實對稱陣的瑞利商來研究,因爲瑞利商是由如下特徵值問題推導出來的,它可以直接求出矩陣的特徵值。
Ax=λx⇒xTAx=λxTx⇒λ=xTxxTAx=R(x)
【瑞利商定義】設A=(aij)∈Rn×n是n階實對稱
矩陣,x∈Rn,則稱下式爲矩陣A的瑞利商(Rayleigh商) R(x)=xTxxTAx(x=0)
【廣義瑞利商定義】設A=(aij)∈Rn×n,B=(bij)∈Rn×n均是n階實對稱
矩陣,且B正定
,x∈Rn,則稱下式爲矩陣A相對於矩陣B的廣義瑞利商
R(x)=xTBxxTAx(x=0)
- 【性質1】:R(x)是x的連續函數
- 【性質2】:R(x)是x的零次齊次函數(齊次性R(kx)=R(x))
事實上,對於任意實數λ=0有下式分別滿足齊次性和零次
R(λx)=R(x)=λ0R(x)
- 【性質3】:當x是由x0=0張成的空間時,R(x)是一常數
- 【性質4】:R(x)的最大最小值存在,且能夠在單位球面S={x∣x∈Rn,∥x∥2=1}上達到
- 【性質5】:非零向量x0是R(x)的
駐點
⇔x0是Ax=λBx的特徵向量
,當B=I時對應於瑞利商問題同理,通過矩陣求導可得
一般情況下,我們令實對稱矩陣A的特徵值按從小到大順序排列如下
λ1≤λ2≤...≤λn
對應標準正交特徵向量係爲p1,p2,...,pn。
【定理】設A=(aij)∈Rn×n是n階實對稱
矩陣,則有 x=0minR(x)=λ1,x=0maxR(x)=λn,λ1≤R(x)≤λn
【證明】任取0=x∈Rn,則有
x=c1p1+c2p2+...+cnpn(c12+c22+...+cn2=0)
由於p1,p2,...,pn是正交特徵向量系,所以有xi=cipi
於是有
AxxTAxxTx=λx=λ1c1p1+λ2c2p2+...+λncnpn=c12λ1+c22λ2+...+cn2λn=c12+c22+...+cn2
令ki=c12+c22+...+cn2ci2,其中k1+k2+...+kn=1,則有
R(x)=xTxxTAx=k1λ1+k2λ2+...+knλn
簡單起見,假設A是2階實對稱陣,即僅有兩個特徵值λ1,λ2滿足R(x)=k1λ1+k2λ2(k1+k2=1),則如下圖所示
從上圖,我們可以清晰的看出R(x)是x的連續函數
,該集合也被稱爲凸包
,由此可得
λ1≤R(x)≤λn
可以通過如下式子驗證R(p1)=λ1
R(pi)=piTpipiTApi=λi
有了pk或xk,我們可以直接求得第k小特徵值λk。但問題來了,如果我們不知道pk或者不想依賴於xk,我們如何求得第k小特徵值λk呢?這就需要下面一章的極小極大原理了。
【重要推論】若λ1=...=λk(1≤k≤n),則在∥x∥2=1上,R(x)的所有極小點爲 l1p1+l2p2+...+lkpk 其中,li∈R(i=1,...,k),且滿足l12+l12+..+lk2=1.
二、普通與廣義特徵值的極小極大原理
由上章,我們得到幾個工具,令Vn=span{x1,x2,...,xn}(λ1≤λ2≤...≤λn)則有
R(x)=xTxxTAx=k1λ1+k2λ2+...+knλn
λ1≤R(x)≤λn⇒{minx=0,x∈VnR(x)=λ1maxx=0,x∈VnR(x)=λn
當我們想求λ2,λn−1時,可以通過縮小張成的子空間得到
λ2=x=0mins.t.R(x)=k1λ1+k2λ2+...+knλnk1=0⋮λi=x=0mins.t.R(x)=k1λ1+k2λ2+...+knλnk1=k2=...=ki−1=0
同理得
λn−1=x=0maxs.t.R(x)=k1λ1+k2λ2+...+knλnkn=0⋮λn−i−1=x=0mins.t.R(x)=k1λ1+k2λ2+...+knλnkn=kn−1=...=kn−i=0
因此,我們可以歸納出如下定理
【定理】設x∈L(pr,pr+1,...,ps),1≤r≤s≤n,則有 x=0minR(x)=λrx=0maxR(x)=λs
2.1 引出問題:由於Vk不唯一導致得到多個特徵值
但以上定理在pr,ps未知下無法使用,因此我們不再指定讓某個係數ki=0,而是選取k維子空間Vk來求,由於Vk是不唯一的,因此可能會得到多個特徵值,例如我們想要得到λ2,則選取Vn−1,有如下兩種情況
x=0minR(x)={λ1ifx1∈Vn−1λ2ifx1∈/Vn−1
x=0maxR(x)={λnifxn∈Vn−1λn−1ifxn∈/Vn−1
2.2 解決問題:使用極大極小原理固定特徵向量
對於上述子空間Vk不唯一情況,得到
0=x∈Vn−1minR(x)≤λ20=x∈Vn−1max R(x)≥λn−1
爲解決此問題,我們使用極小極大原理得到
λ2=Vn−1max[0=x∈Vn−1minR(x)],λn−1=Vn−1min[0=x∈Vn−1maxR(x)]
爲此,我們歸納出一般的式子,我們
【定理】設Vk是Rn中的任意一個k維子空間,則普通特徵值
問題與廣義特徵值
問題從小到大
的第k個特徵值和n−(k−1)個特徵值具有如下極小極大性質
λn−(k−1)=Vkmax[0=x∈VkminR(x)],λk=Vkmin[0=x∈VkmaxR(x)]
- 左式被稱爲特徵值的
極大極小
原理
- 右式被稱爲特徵值的
極小極大
原理
三、矩陣奇異值的極小極大性質
我們通過矩陣瑞利商的極小極大原理,可以衍生到解決奇異值問題,我們將矩陣A∈Rrm×n的奇異值排列如下 [其中,σi=λi(ATA)]
0=σ1=σ2=...=σn−r≤σn−r+1≤...≤σn
我們令B=ATA,則實對稱矩陣B的瑞利商如下
R(x)=xTxxTBx=xTxxT(ATA)x=xTx(Ax)TAx=∥x∥22∥Ax∥22=λ=σ
則矩陣A的第k個奇異值和第n−k+1個奇異值具有如下極小極大性質
σn−(k−1)=Vkmax[0=x∈Vkmin∥x∥2∥Ax∥2],σk=Vkmin[0=x∈Vkmax∥x∥2∥Ax∥2]
其中,Vk是Rn中的任意一個k維子空間。
附錄:矩陣直積(Kronecker積)的概念
運用矩陣的直積運算,能夠將線性矩陣方程轉換爲線性代數方程組進行求解
【定義】設A=(aij)∈Cm×n,B=(bij)∈Cp×q,則稱如下分塊矩陣爲A與B的直積(Kronecker積)
參考文獻
程雲鵬, 凱院, 仲. 矩陣論[M]. 西北工業大學出版社, 2006.