前言
在许多实际问题中,所产生的矩阵往往都是对称矩阵,比如我们耳熟能详的实对称矩阵也是重要的研究对象。以下就从实对称矩阵的角度出发,利用特征值的极小极大原理
,从普通特征值问题Ax=λx衍生到广义特征值问题Ax=λBx逐步讨论其特征值的性质。
【广义特征值问题】设A=(aij)∈Rn×n是n阶实对称
矩阵,B=(bij)∈Rn×n是n阶实对称正定
矩阵,使下式 Ax=λBx 有非零解向量x∈Rn,则称λ是矩阵A相对于矩阵B的特征值,且x是属于λ的特征向量。该问题常见于振动理论。
我们可以发现
- 当B=I时,该问题是
广义特征值问题
- 当B=I时,该问题是
普通特征值问题
思路:如何利用极小极大原理求第k个特征值及奇异值?
利用极大极小原理,我们先确定n阶实对称阵的最大最小特征值,然后逐步求第2大和第2小特征值进而归纳到求第k大和第k小特征值。
本文就对称矩阵特征值的极性与直积做以梳理,完整定理证明请参考西工大的《矩阵论》[1]。
一、实对称矩阵的瑞利商与广义瑞利商性质
我们在讨论实对称矩阵的特征值时,往往会通过实对称阵的瑞利商来研究,因为瑞利商是由如下特征值问题推导出来的,它可以直接求出矩阵的特征值。
Ax=λx⇒xTAx=λxTx⇒λ=xTxxTAx=R(x)
【瑞利商定义】设A=(aij)∈Rn×n是n阶实对称
矩阵,x∈Rn,则称下式为矩阵A的瑞利商(Rayleigh商) R(x)=xTxxTAx(x=0)
【广义瑞利商定义】设A=(aij)∈Rn×n,B=(bij)∈Rn×n均是n阶实对称
矩阵,且B正定
,x∈Rn,则称下式为矩阵A相对于矩阵B的广义瑞利商
R(x)=xTBxxTAx(x=0)
- 【性质1】:R(x)是x的连续函数
- 【性质2】:R(x)是x的零次齐次函数(齐次性R(kx)=R(x))
事实上,对于任意实数λ=0有下式分别满足齐次性和零次
R(λx)=R(x)=λ0R(x)
- 【性质3】:当x是由x0=0张成的空间时,R(x)是一常数
- 【性质4】:R(x)的最大最小值存在,且能够在单位球面S={x∣x∈Rn,∥x∥2=1}上达到
- 【性质5】:非零向量x0是R(x)的
驻点
⇔x0是Ax=λBx的特征向量
,当B=I时对应于瑞利商问题同理,通过矩阵求导可得
一般情况下,我们令实对称矩阵A的特征值按从小到大顺序排列如下
λ1≤λ2≤...≤λn
对应标准正交特征向量系为p1,p2,...,pn。
【定理】设A=(aij)∈Rn×n是n阶实对称
矩阵,则有 x=0minR(x)=λ1,x=0maxR(x)=λn,λ1≤R(x)≤λn
【证明】任取0=x∈Rn,则有
x=c1p1+c2p2+...+cnpn(c12+c22+...+cn2=0)
由于p1,p2,...,pn是正交特征向量系,所以有xi=cipi
于是有
AxxTAxxTx=λx=λ1c1p1+λ2c2p2+...+λncnpn=c12λ1+c22λ2+...+cn2λn=c12+c22+...+cn2
令ki=c12+c22+...+cn2ci2,其中k1+k2+...+kn=1,则有
R(x)=xTxxTAx=k1λ1+k2λ2+...+knλn
简单起见,假设A是2阶实对称阵,即仅有两个特征值λ1,λ2满足R(x)=k1λ1+k2λ2(k1+k2=1),则如下图所示
从上图,我们可以清晰的看出R(x)是x的连续函数
,该集合也被称为凸包
,由此可得
λ1≤R(x)≤λn
可以通过如下式子验证R(p1)=λ1
R(pi)=piTpipiTApi=λi
有了pk或xk,我们可以直接求得第k小特征值λk。但问题来了,如果我们不知道pk或者不想依赖于xk,我们如何求得第k小特征值λk呢?这就需要下面一章的极小极大原理了。
【重要推论】若λ1=...=λk(1≤k≤n),则在∥x∥2=1上,R(x)的所有极小点为 l1p1+l2p2+...+lkpk 其中,li∈R(i=1,...,k),且满足l12+l12+..+lk2=1.
二、普通与广义特征值的极小极大原理
由上章,我们得到几个工具,令Vn=span{x1,x2,...,xn}(λ1≤λ2≤...≤λn)则有
R(x)=xTxxTAx=k1λ1+k2λ2+...+knλn
λ1≤R(x)≤λn⇒{minx=0,x∈VnR(x)=λ1maxx=0,x∈VnR(x)=λn
当我们想求λ2,λn−1时,可以通过缩小张成的子空间得到
λ2=x=0mins.t.R(x)=k1λ1+k2λ2+...+knλnk1=0⋮λi=x=0mins.t.R(x)=k1λ1+k2λ2+...+knλnk1=k2=...=ki−1=0
同理得
λn−1=x=0maxs.t.R(x)=k1λ1+k2λ2+...+knλnkn=0⋮λn−i−1=x=0mins.t.R(x)=k1λ1+k2λ2+...+knλnkn=kn−1=...=kn−i=0
因此,我们可以归纳出如下定理
【定理】设x∈L(pr,pr+1,...,ps),1≤r≤s≤n,则有 x=0minR(x)=λrx=0maxR(x)=λs
2.1 引出问题:由于Vk不唯一导致得到多个特征值
但以上定理在pr,ps未知下无法使用,因此我们不再指定让某个系数ki=0,而是选取k维子空间Vk来求,由于Vk是不唯一的,因此可能会得到多个特征值,例如我们想要得到λ2,则选取Vn−1,有如下两种情况
x=0minR(x)={λ1ifx1∈Vn−1λ2ifx1∈/Vn−1
x=0maxR(x)={λnifxn∈Vn−1λn−1ifxn∈/Vn−1
2.2 解决问题:使用极大极小原理固定特征向量
对于上述子空间Vk不唯一情况,得到
0=x∈Vn−1minR(x)≤λ20=x∈Vn−1max R(x)≥λn−1
为解决此问题,我们使用极小极大原理得到
λ2=Vn−1max[0=x∈Vn−1minR(x)],λn−1=Vn−1min[0=x∈Vn−1maxR(x)]
为此,我们归纳出一般的式子,我们
【定理】设Vk是Rn中的任意一个k维子空间,则普通特征值
问题与广义特征值
问题从小到大
的第k个特征值和n−(k−1)个特征值具有如下极小极大性质
λn−(k−1)=Vkmax[0=x∈VkminR(x)],λk=Vkmin[0=x∈VkmaxR(x)]
- 左式被称为特征值的
极大极小
原理
- 右式被称为特征值的
极小极大
原理
三、矩阵奇异值的极小极大性质
我们通过矩阵瑞利商的极小极大原理,可以衍生到解决奇异值问题,我们将矩阵A∈Rrm×n的奇异值排列如下 [其中,σi=λi(ATA)]
0=σ1=σ2=...=σn−r≤σn−r+1≤...≤σn
我们令B=ATA,则实对称矩阵B的瑞利商如下
R(x)=xTxxTBx=xTxxT(ATA)x=xTx(Ax)TAx=∥x∥22∥Ax∥22=λ=σ
则矩阵A的第k个奇异值和第n−k+1个奇异值具有如下极小极大性质
σn−(k−1)=Vkmax[0=x∈Vkmin∥x∥2∥Ax∥2],σk=Vkmin[0=x∈Vkmax∥x∥2∥Ax∥2]
其中,Vk是Rn中的任意一个k维子空间。
附录:矩阵直积(Kronecker积)的概念
运用矩阵的直积运算,能够将线性矩阵方程转换为线性代数方程组进行求解
【定义】设A=(aij)∈Cm×n,B=(bij)∈Cp×q,则称如下分块矩阵为A与B的直积(Kronecker积)
参考文献
程云鹏, 凯院, 仲. 矩阵论[M]. 西北工业大学出版社, 2006.