特征值与特征向量

1. 什么是特征值?

数学上,特别是线性代数中,对于一个给定的矩阵A,它的特征向量(eigenvector,也译固有向量本征向量v 经过这个线性变换[1]之后,得到的新向量仍然与原来的v 保持在同一条直线上,但其长度或方向也许会改变。即

{\displaystyle Av=\lambda v}{\displaystyle Av=\lambda v}

{\displaystyle \lambda }\lambda标量,即特征向量的长度在该线性变换下缩放的比例,称{\displaystyle \lambda }\lambda 为其特征值(本征值)。如果特征值为正,则表示{\displaystyle v}v 在经过线性变换的作用后方向也不变;如果特征值为负,说明方向会反转;如果特征值为0,则是表示缩回零点。但无论怎样,仍在同一条直线上。在一定条件下(如其矩阵形式为实对称矩阵的线性变换),一个变换可以由其特征值和特征向量完全表述,也就是说:所有的特征向量组成了这向量空间的一组基底。一个特征空间(eigenspace)是具有相同特征值的特征向量与一个同维数的零向量的集合,可以证明该集合是一个线性子空间,比如{\displaystyle \textstyle E_{\lambda }=\{u\in V\mid Au=\lambda u\}}{\displaystyle \textstyle E_{\lambda }=\{u\in V\mid Au=\lambda u\}} 即为线性变换{\displaystyle A}A 中以{\displaystyle \lambda }\lambda 为特征值的特征空间

这些概念在纯数学应用数学的众多领域中都有重要的应用。在线性代数泛函分析之外,甚至在一些非线性的情况下,这些概念都是十分重要的。

“特征”一词译自德语的eigen,由希尔伯特在1904年首先在这个意义下使用(赫尔曼·冯·亥姆霍兹在更早的时候也在类似意义下使用过这一概念)。eigen一词可翻译为“自身的”,“特定于...的”,“有特征的”或者“个体的”—这强调了特征值对于定义特定的变换上是很重要的。

2.  定义

给定一个向量空间{\displaystyle \mathbf {E} }\mathbf {E},从{\displaystyle \mathbf {E} }\mathbf {E}{\displaystyle \mathbf {E} }\mathbf {E}自身的线性变换{\displaystyle \mathbf {T} }\mathbf{T}是—个保持向量加法标量向量这两种运算的函数,例如旋转反射拉伸压缩,或者这些变换的组合等等。一个线性变换可以通过它们在向量上的作用来可视化。一般来说,一个向量在经过映射之后可以变为任何可能的向量,而特征向量具有更好的性质。

一个线性变换{\displaystyle \mathbf {T} :\mathbf {E} \mapsto \mathbf {E} }{\displaystyle \mathbf {T} :\mathbf {E} \mapsto \mathbf {E} }特征向量{\displaystyle v}v 是一个非零向量且在这个线性变换下的新向量为{\displaystyle v}v 简单地乘以一个标量{\displaystyle \lambda }\lambda。也就是说存在一个标量{\displaystyle \lambda }\lambda 使得{\displaystyle v}v满足下式:

{\displaystyle \mathbf {T} (v)=\lambda v}{\displaystyle \mathbf {T} (v)=\lambda v}

其中的缩放因子{\displaystyle \lambda }\lambda 称为这个特征向量的特征值,或者说是线性变换{\displaystyle \mathbf {T} }\mathbf{T}的特征值。反过来,一个实数{\displaystyle \lambda }\lambda是线性变换{\displaystyle \mathbf {T} }\mathbf{T}的一个特征值,当且仅当有一个非零向量{\displaystyle v}v满足上面的式子[2][3]

所有具有相同的特征值{\displaystyle \lambda }\lambda的特征向量和零向量一起,组成了一个向量空间,称为线性变换的一个特征空间,一般记作{\displaystyle \mathbb {E} _{\lambda }(\mathbf {T} )}\mathbb{E}_{\lambda}(\mathbf{T})。这个特征空间如果是有限维的,那么它的维数叫做{\displaystyle \lambda }\lambda几何重数

变换的主特征向量最大的特征值对应的特征向量。有限维向量空间上的一个变换的是其所有特征值的集合

特征向量也可以看作是关于系数{\displaystyle \lambda }\lambda的方程:

{\displaystyle \mathbf {T} (x)=\lambda x}{\displaystyle \mathbf {T} (x)=\lambda x}

的非零解。显然只有在{\displaystyle \lambda }\lambda是变换{\displaystyle \mathbf {T} }\mathbf{T}的特征值之时,方程才有非零解。

3. 例子 

随着地球的自转,每个从地心往外指的箭头都在旋转,除了在转轴上的那些箭头。考虑地球在一小时自转后的变换:地心指向地理南极的箭头是这个变换的一个特征向量,并且因为指向极点的箭头没有被地球的自转拉伸,它的特征值是1;但是从地心指向赤道任何一处的箭头不会是一个特征向量。

另一个例子是,薄金属板关于一个固定点均匀伸展,使得板上每一个点到该固定点的距离翻倍。这个伸展是一个有特征值2的变换。从该固定点到板上任何一点的向量是一个特征向量,而相应的特征空间是所有这些向量的集合。

图2.一个两端固定的绳子上的驻波可以视为特征向量的一个例子,更精确的讲,它是一个相对于时间流逝的变换的特征函数。随着时间流逝,驻波被缩放,但是它的形状不变。在这个例子中,特征值是依赖于时间的。

但是,三维几何空间不是唯一的向量空间。例如,考虑两端固定的拉紧的绳子,就像弦乐器振动弦那样(图2.)。振动弦的原子到它们在弦静止时的位置之间的带符号那些距离视为一个空间中的一个向量的分量,那个空间的维数就是弦上原子的个数。

如果考虑绳子随着时间流逝发生的变换,它的特征向量,或者说特征函数(如果将绳子假设为一个连续媒介),就是它的驻波—也就是那些通过空气的传播让人们听到弓弦吉他的拨动声的振动。驻波对应于弦的特定振动,它们使得弦的形状随着时间变化而伸缩一个因子(特征值)。和弦相关的该向量的每个分量乘上了一个依赖于时间的因子。驻波的振幅(特征值)在考虑到阻尼的情况下逐渐减弱。因此可以将每个特征向量对应于一个寿命,并将特征向量的概念和共振的概念联系起来。

4. 特征值方程

从数学上看,如果向量v与变换{\displaystyle {\mathcal {T}}}\mathcal{T}满足

{\displaystyle {\mathcal {T}}(\mathbf {v} )=\lambda \,\mathbf {v} }\mathcal{T}(\mathbf{v})=\lambda\,\mathbf{v}

则称向量v是变换{\displaystyle {\mathcal {T}}(\cdot )}\mathcal{T}(\cdot)的一个特征向量,λ是相应的特征值。其中{\displaystyle {\mathcal {T}}(\mathbf {v} )}\mathcal{T}(\mathbf{v})是将变换{\displaystyle {\mathcal {T}}(\cdot )}\mathcal{T}(\cdot)作用于v得到的向量。

假设{\displaystyle {\mathcal {T}}(\cdot )}\mathcal{T}(\cdot)是一个线性变换,那么v可以由其所在向量空间的一组表示为:

{\displaystyle \mathbf {v} =\sum _{i=1}^{n}v_{i}\mathbf {e} _{i}}\mathbf{v} = \sum_{i=1}^n v_i\mathbf{e}_i

其中{\displaystyle v_{i}}v_i是向量{\displaystyle \mathbf {v} }\mathbf {v}基向量{\displaystyle \mathbf {e} _{i}}\mathbf{e}_i上的投影(即座标),这里假设向量空间为n 。由此,{\displaystyle \mathbf {v} }\mathbf {v}可以直接以座标向量{\displaystyle v=(v_{1},\ldots ,v_{n})^{T}}v=(v_1,\ldots,v_n)^T表示。利用基向量,线性变换{\displaystyle {\mathcal {T}}(\cdot )}\mathcal{T}(\cdot)也可以用一个简单的矩阵乘法表示。上述的特征值方程可以表示为:

{\displaystyle T\,v=\lambda \,v}T\,v=\lambda\,v

但是,有时候用矩阵形式写下特征值方程是不自然甚或不可能的。例如在向量空间是无穷维的时候,上述的弦的情况就是一例。取决于变换{\displaystyle {\mathcal {T}}}\mathcal{T}和它所作用的空间的性质,有时将特征值方程表示为一组微分方程更好。若{\displaystyle {\mathcal {T}}}\mathcal{T}是一个微分算子,其特征向量通常称为该微分算子的特征函数。例如,微分本身是一个线性变换因为(若MN可微函数,而ab常数

{\displaystyle {\frac {d}{dt}}(aM+bN)=a{\frac {dM}{dt}}+b{\frac {dN}{dt}}}\frac{d}{dt}(aM+bN) = a \frac{dM}{dt} + b\frac{dN}{dt}

考虑对于时间{\displaystyle t}t的微分。其特征函数满足如下特征值方程:

{\displaystyle {\frac {dN}{dt}}=\lambda N}\frac{dN}{dt} = \lambda N,

其中λ是该函数所对应的特征值。这样一个时间的函数,如果{\displaystyle \lambda =0}\lambda = 0,它就不变,如果{\displaystyle \lambda }\lambda为正,它就按比例增长,如果{\displaystyle \lambda }\lambda是负的,它就按比例衰减。例如,理想化的兔子的总数在兔子更多的地方繁殖更快,从而满足一个正λ的特征值方程。

该特征值方程的解是{\displaystyle N=\exp(\lambda t)}N= \exp (\lambda t),也即指数函数;这样,该函数是微分算子d/dt的特征值为λ的特征函数。若λ是一个负数,我们称N的演变为一个指数衰减;若它是正数,则称指数增长λ的值可以是一个任意复数。因此d/dt的谱是整个复平面。在这个例子中,算子d/dt作用的空间是单变量可微函数的空间。该空间有无穷维(因为不是每一个可微函数都可以用有限的基函数线性组合来表达的)。但是,每个特征值λ所对应的特征空间是一维的。它就是所有形为{\displaystyle N=N_{0}\exp(\lambda t)}N= N_0 \exp (\lambda t)的函数的集合。N0是任意常数,也就在t=0的初始数量。

5. 计算矩阵的特征值和特征向量

假设我们想要计算给定矩阵的特征值。若矩阵很小,我们可以用特征多项式进行符号演算。但是,对于大型矩阵这通常是不可行的,在那种情况我们必须采用数值方法

形式计算 

描述正方形矩阵的特征值的重要工具是特征多项式:就如之前的例子一样,说λA的特征值等价于说线性系统A – λIv = 0(其中I单位矩阵)有非零解v(一个特征向量),因此等价于说行列式

{\displaystyle \det(A-\lambda I)=0\!\ }\det(A - \lambda I) = 0 \!\

函数:{\displaystyle p_{A}(\lambda )=\det(A-\lambda I)\!\ }p_A(\lambda) = \det(A - \lambda I) \!\是一个关于λ多项式,称为A特征多项式。矩阵的特征值也就是其特征多项式的零点。求一个矩阵A的特征值可以通过求解方程{\displaystyle p_{A}(\lambda )=0}p_A(\lambda) = 0来得到。

A是一个n×n矩阵,则{\displaystyle p_{A}}p_An次多项式,因而A最多有n个特征值。反过来,如果A的系数是在一个代数闭域里面(比如说复数域),那么代数基本定理说明这个方程刚好有n(如果重根也计算在内的话)。所有奇数次的多项式必有一个实数根,因此当n为奇数的时候,每个n维实系数矩阵至少有一个实数特征值。当矩阵系数是实数的时候,非实数的特征值会成共轭对出现。

一旦找到特征值λ,相应的特征向量就可以通过求解如下方程得到:

{\displaystyle (A-\lambda I)v=0\!\ }{\displaystyle (A-\lambda I)v=0\!\ }

实系数的矩阵不一定有实数特征值。比如对于以下的矩阵(表示二维平面上的顺时针90°的一个旋转变换):

{\displaystyle {\begin{bmatrix}0&1\\-1&0\end{bmatrix}}}\begin{bmatrix}0 & 1\\ -1 & 0\end{bmatrix}

其特征多项式是{\displaystyle \lambda ^{2}+1}\lambda^2+1,因此其特征值成复共轭对出现,分别是i和-i,而没有实数特征值。相应的特征向量也是非实数的。

数值计算 

在实践中,大型矩阵的特征值无法通过特征多项式计算。计算该多项式本身相当费资源,而根的精确表达式对于高次的多项式来说很难计算和表达:阿贝尔-鲁菲尼定理显示五次或更高次的多项式的根无法用{\displaystyle n}n次方根来简单表达。对于估算多项式的根的有效算法是有的,但特征值中的微小误差可以导致特征向量的巨大误差。因此,寻找特征多项式和特征值的一般算法,是迭代法。最简单的方法是幂法:取一个随机向量{\displaystyle v}v,然后计算如下的一系列单位向量

{\displaystyle {\frac {Av}{||Av||}}}\frac{Av}{||Av||}{\displaystyle {\frac {A^{2}v}{||A^{2}v||}}}\frac{A^2v}{||A^2v||}{\displaystyle {\frac {A^{3}v}{||A^{3}v||}}}\frac{A^3v}{||A^3v||}, ...

这个序列几乎总是收敛于最大绝对值的特征值所对应的特征向量。这个算法很简单,但是本身不是很有用。但是,象QR算法这样的算法正是以此为基础的。


6. 性质

代数重次

A的一个特征值λ的代数重数是λ作为A的特征多项式的根的次数;换句话说,若r是该多项式的一个根,它是一次多项式因子(λ - r)在特征多项式中在因式分解后中出现的次数。如果将代数重次计算在内的话,一个n×n矩阵有n个特征值,因为其特征多项式次数为n

一个代数重次1的特征值为“单特征值”。

在关于矩阵理论的条目中,可能会遇到如下的表示方法:

"一个矩阵A的特征值为4,4,3,3,3,2,2,1,"

表示4的代数重次为二,3的是三,2的是二,而1的是1。这样写是因为代数重次对于矩阵理论中的很多数学证明很重要而被大量使用。

和代数重数相对的是特征值的几何重数:特征值相对应的特征空间(也就是λI − A零空间)的维数。代数重次也可以视为一种维数:它是相应广义特征空间的维数,也就是当自然数k足够大的时候矩阵(λI − Ak的零空间。也就是说,它是所有“广义特征向量”组成的空间,其中一个广义特征向量是任何一个如果λI − A作用连续作用足够多次就“最终”会变0的向量。任何特征向量都是一个广义特征向量,以此任一个特征空间都被包含于相应的广义特征空间。这给了一个几何重次总是小于或等于代数重次的简单证明。

例如:

{\displaystyle A={\begin{bmatrix}1&1\\0&1\end{bmatrix}}}{\displaystyle A={\begin{bmatrix}1&1\\0&1\end{bmatrix}}}

它只有一个特征值,也就是λ = 1。其特征多项式是{\displaystyle (\lambda -1)^{2}}(\lambda-1)^2,所以这个特征值代数重次为2。但是,相应特征空间是通常称为x轴的数轴,由向量{\displaystyle {\begin{bmatrix}1\\0\end{bmatrix}}}\begin{bmatrix} 1 \\ 0  \end{bmatrix}线性生成,所以几何重次只是1。

广义特征向量可以用于计算一个矩阵的若尔当标准型(参看下面的讨论)。若尔当块通常不是对角化而是幂零的这个事实与特征向量和广义特征向量之间的区别直接相关。

一般矩阵分解定理

如上所述,谱定理表明正方形矩阵可以对角化当且仅当它是正规的。对于更一般的未必正规的矩阵,我们有类似的结果。当然在一般的情况,有些要求必须放松,例如酉等价性或者最终的矩阵的对角性。所有这些结果在一定程度上利用了特征值和特征向量。下面列出了一些这样的结果:

  • 舒尔三角形式表明任何矩阵酉等价于一个上三角矩阵;
  • 奇异值分解{\displaystyle A=U\Sigma V^{*}}A=U \Sigma V^*其中{\displaystyle \Sigma }\Sigma为对角阵,而U,V为酉矩阵。{\displaystyle A=U\Sigma V^{*}}A=U \Sigma V^*的对角线上的元素非负,而正的项称为A的奇异值。这对非正方形矩阵也成立;
  • 若尔当标准型,其中{\displaystyle A=U\Lambda U^{-1}}A=U \Lambda U^{-1}其中{\displaystyle \Lambda }\Lambda不是对角阵,但是分块对角阵,而{\displaystyle U}U是酉矩阵。若尔当块的大小和个数由特征值的几何和代数重次决定。若尔当分解是一个基本的结果。从它可以立即得到一个正方形矩阵可以完全用它的特征值包括重次来表述,最多只会相差一个酉等价。这表示数学上特征值在矩阵的研究中有着极端重要的作用。
  • 作为若尔当分解的直接结果,一个矩阵A可以“唯一”地写作A = S + N其中S可以对角化,N幂零的(也即,对于某个qNq=0),而SN可交换(SN=NS)。
  • 任何可逆矩阵A可以唯一地写作A = SJ,其中S可对角化而J么幂矩阵(也即,使得特征多项式是(λ-1)的幂,而SJ可交换)。

特征值的一些另外的属性

谱在相似变换不变:矩阵AP-1AP有相同的特征值,这对任何矩阵A和任何可逆矩阵P都成立。谱在转置之下也不变:矩阵AAT有相同的特征值。

因为有限维空间上的线性变换是双射当且仅当它是单射,一个矩阵可逆当且仅当所有特征值都不是0。

若尔当分解的一些更多的结果如下:

  • 一个矩阵是对角矩阵当且仅当代数和几何重次对于所有特征值都相等。特别的有,一个n×n矩阵如果有n不同特征值,则总是可以对角化的。
  • 矩阵作用的向量空间可以视为其广义特征向量所撑成的不变子空间的直和。对角线上的每个块对应于该直和的一个子空间。若一个块是对角化的,其不变子空间是一个特征空间。否则它是一个广义特征空间,如上面所定义;
  • 因为,也就是矩阵主对角线元素之和,在酉等价下不变,若尔当标准型说明它等于所有特征值之和;
  • 类似的有,因为三角矩阵的特征值就是主对角线上的项,其行列式等于等于特征值的乘积(按代数重次计算出现次数)。

正规矩阵的一些子类的谱的位置是:

假设A是一个m×n矩阵,其中m ≤ n,而B是一个n×m矩阵。则BA有和AB相同的特征值加上n − m个等于0的特征值。

每个矩阵可以被赋予一个算子范数。算子范数是其特征值的模的上确界,因而也是它的谱半径。该范数直接和计算最大模的特征值的幂法直接相关。当一个矩阵是正规的,其算子范数是其特征值的最大模,并且独立于其定义域的范数。

共轭特征向量

一个共轭特征向量或者说共特征向量是一个在变换下成为其共轭乘以一个标量的向量,其中那个标量称为该线性变换的共轭特征值或者说共特征值。共轭特征变量和共轭特征值代表了和常规特征向量和特征值相同的信息和含义,但是在交替座标系统被使用的时候出现。对应的方程是:

{\displaystyle Av=\lambda v^{*}.\,}Av = \lambda v^*.\,

例如,在相干电磁散射理论中,线性变换A代表散射物体施行的作用,而特征向量表示电磁波的极化状态。在光学中,座标系统按照波的观点定义,称为前向散射对齐(FSA),从而导致了常规的特征值方程,而在雷达中,座标系统按照雷达的观点定义,称为后向散射对齐(BSA),从而给出了共轭特征值方程。

广义特征值

一个广义特征值(第二种意义)有如下形式

{\displaystyle Av=\lambda Bv\quad \quad }Av = \lambda B v \quad \quad

其中AB为矩阵。其广义特征值(第二种意义)λ 可以通过求解如下方程得到

{\displaystyle \det(A-\lambda B)=0.\,}\det(A - \lambda B)=0.\,

形如{\displaystyle A-\lambda B}A - \lambda B的矩阵的集合,其中{\displaystyle \lambda }\lambda是一个复数,称为一个“丛(pencil)”。若B可逆,则最初的问题可以写作如下形式

{\displaystyle B^{-1}Av=\lambda v\quad \quad }B^{-1}Av = \lambda v \quad \quad

也即标准的特征值问题。但是,在很多情况下施行逆操作是不可取的,而广义特征值问题应该如同其原始表述来求解。

如果AB是实系数的对称矩阵,则特征值为实数。这在上面的第二种等价表述中并不明显,因为矩阵{\displaystyle B^{-1}A}B^{-1}A未必是对称的。

这里的一个例子是分子轨道应用如下

系数为环中元素

在方矩阵A,其系数属于一个环的情况,λ称为一个右特征值如果存在一个列向量x使得Axx,或者称为一个左特征值如果存在非零行向量y使得yA=yλ。

若环是可交换的,左特征值和右特征值相等,并简称为特征值。否则,例如当环是四元数集合的时候,它们可能是不同的。

7. 应用

应用

薛定谔方程

图3、电子的概率密度绘图。横向展示不同的角量子数,竖向展示不同的能级(n)。束缚于氢原子内的电子波函数可以视为氢原子的哈密顿算子的特征向量,同时也是角动量算子的一个特征向量。它们对应于能级(递增:n=1,2,3,...)和角动量(递增:spd,...)的特征值。这里绘出了波函数绝对值的平方。更亮区域对应于位置的量子测量的更高概率密度。位于每幅图的中心是原子核,是一个质子

量子力学中,不含时薛定谔方程是一个以微分算子代表的变换{\displaystyle T\,}T\,的特征值方程,能够描述一个粒子的量子行为:

{\displaystyle H\Psi _{E}=E\Psi _{E}\,}H\Psi_E = E\Psi_E\,

其中,{\displaystyle H\,}H\,哈密顿算子,一个二阶微分算子{\displaystyle \Psi _{E}\,}\Psi_E\,是描述粒子的量子行为的波函数,对应于特征值{\displaystyle E\,}E\,的特征函数,该值可以解释为粒子的能量

假设,我们只想寻找薛定谔方程的束缚态(bound state)解,那么,可以在平方可积函数的空间中寻找{\displaystyle \Psi _{E}\,}\Psi_E\,。由于这个空间是希尔伯特空间,有一个定义良好的标量积,我们可以引入一个基集合,然后表示{\displaystyle \Psi _{E}\,}\Psi_E\,{\displaystyle H\,}H\,为一个一维数组和一个矩阵。这样,我们能够用矩阵形式表达薛定谔方程。(图3表示氢原子哈密顿算子的最低能级特征函数。)

狄拉克标记经常在这个上下文中使用,以强调量子态{\displaystyle \Psi _{E}\,}\Psi_E\,态向量{\displaystyle |\Psi _{E}\rangle \,}|\Psi_E\rangle\,和它表示于位置空间的波函数{\displaystyle \Psi _{E}(x)\,}\Psi_E(x)\,之间的区别。采用狄拉克标记,薛定谔方程写为

{\displaystyle H|\Psi _{E}\rangle =E|\Psi _{E}\rangle \,}H|\Psi_E\rangle = E|\Psi_E\rangle\,

并称{\displaystyle |\Psi _{E}\rangle \,}|\Psi_E\rangle\,{\displaystyle H\,}H\,的一个本征态{\displaystyle H\,}H\,有时候在入门级课本中写作{\displaystyle {\hat {H}}\,}\hat{H}\,),{\displaystyle H\,}H\,是一个自伴算子参看可观察量)。在上述方程中,{\displaystyle H|\Psi _{E}\rangle \,}H|\Psi_E\rangle\,理解为通过作用{\displaystyle H\,}H\,{\displaystyle |\Psi _{E}\rangle \,}|\Psi_E\rangle\,得到的一个新的态向量。

分子轨域

量子力学中,特别是在原子物理分子物理中,在Hartree-Fock理论下,原子轨域分子轨域可以定义为Fock算子的特征向量。相应的特征值通过Koopmans定理可以解释为电离势能。在这个情况下,特征向量一词可以用于更广泛的意义,因为Fock算子显式地依赖于轨道和它们地特征值。如果需要强调这个特点,可以称它为隐特征值方程。这样地方程通常采用迭代程序求解,在这个情况下称为自洽场方法。在量子化学中,经常会把Hartree-Fock方程通过非正交基集合来表达。这个特定地表达是一个广义特征值问题称为Roothaan方程

因子分析

因素分析中,一个协方差矩阵的特征向量对应于因素,而特征值是因素负载。因素分析是一种统计学技术,用于社会科学市场分析产品管理运筹规划和其他处理大量数据的应用科学。其目标是用称为因素的少量的不可观测随机变量来解释在一些可观测随机变量中的变化。可观测随机变量用因素的线性组合来建模,再加上“残差项。

振动分析[编辑]

悬臂梁的几种振动模态
侧向弯曲
扭转弯曲
垂直弯曲

在对于多自由度机械结构作振动分析时,常常会遇到特征值问题。经过仔细解析,求得的特征值会给出振动的自然频率,而特征向量则会给出振动模态的振动行为。由于特征向量的相互正交性质,允许对应的微分方程能够解耦合(decouple),整个系统可以表示为特征向量的线性总和。有限元分析是一种非常优良的方法,时常用来解析复杂结构的特征值问题。

特征脸

图4. 特征脸是特征变量的例子

图像处理中,部图像的处理可以看作分量为每个像素灰度的向量。该向量空间的维数是像素的个数。一个标准化面部图形的一个大型数据集合的协方差矩阵的特征向量称为特征脸。它们对于将任何面部图像表达为它们的线性组合非常有用。特征脸提供了一种用于识别目的的数据压缩的方式。在这个应用中,一般只取那些最大特征值所对应的特征脸[11]

惯性张量

采用直角座标系的三个座标轴为参考轴,一个刚体的惯性张量{\displaystyle {\mathcal {I}}\,}\mathcal{I}\,,以矩阵形式表达为

{\displaystyle {\mathcal {I}}={\begin{bmatrix}I_{xx}&I_{xy}&I_{xz}\\I_{yx}&I_{yy}&I_{yz}\\I_{zx}&I_{zy}&I_{zz}\end{bmatrix}}\,}\mathcal{I} = \begin{bmatrix}I_{xx} & I_{xy} & I_{xz} \\I_{yx} & I_{yy} & I_{yz} \\I_{zx} & I_{zy} & I_{zz}\end{bmatrix}\, 

其中,矩阵的元素以方程表达为

{\displaystyle I_{xx}\ {\stackrel {\mathrm {def} }{=}}\ \int y^{2}+z^{2}\ dm\qquad \qquad I_{xy}=I_{yx}\ {\stackrel {\mathrm {def} }{=}}\ -\int xy\ dm\,}I_{xx}\ \stackrel{\mathrm{def}}{=}\ \int  y^2+z^2\ dm\qquad\qquad I_{xy}=I_{yx}\ \stackrel{\mathrm{def}}{=}\ - \int  xy\ dm\,
{\displaystyle I_{yy}\ {\stackrel {\mathrm {def} }{=}}\ \int x^{2}+z^{2}\ dm\qquad \qquad I_{xz}=I_{zx}\ {\stackrel {\mathrm {def} }{=}}\ -\int xz\ dm\,}I_{yy}\ \stackrel{\mathrm{def}}{=}\ \int x^2+z^2\ dm\qquad\qquad I_{xz}=I_{zx}\ \stackrel{\mathrm{def}}{=}\ - \int xz\ dm\,
{\displaystyle I_{zz}\ {\stackrel {\mathrm {def} }{=}}\ \int x^{2}+y^{2}\ dm\qquad \qquad I_{yz}=I_{zy}\ {\stackrel {\mathrm {def} }{=}}\ -\int yz\ dm\,}I_{zz}\ \stackrel{\mathrm{def}}{=}\ \int x^2+y^2\ dm\qquad\qquad I_{yz}=I_{zy}\ \stackrel{\mathrm{def}}{=}\ - \int yz\ dm\,

{\displaystyle (x,\ y,\ z)\,}(x,\ y,\ z)\,是刚体内部的微小体积元{\displaystyle dm\,}dm\,的位置。

惯性张量{\displaystyle {\mathcal {I}}\,}\mathcal{I}\,是个实值的三维对称矩阵,对角元素{\displaystyle I_{xx}\,}I_{xx}\,{\displaystyle I_{yy}\,}I_{yy}\,{\displaystyle I_{zz}\,}I_{zz}\,分别为刚体对于x-轴、y-轴、z-轴的转动惯量。非对角元素{\displaystyle I_{\alpha \beta },\alpha \neq \beta \,}I_{\alpha\beta}, \alpha\ne\beta\,是刚体对于{\displaystyle \alpha \,}\alpha \,-轴和{\displaystyle \beta \,}\beta\,-轴的惯量积。根据谱定理,可以使惯性张量成为一个对角矩阵。所得到的三个特征值必是正实值;三个特征向量必定互相正交

换另外一种方法,我们需要求解特征方程

{\displaystyle {\mathcal {I}}\ {\boldsymbol {\omega }}=\lambda \;{\boldsymbol {\omega }}\,}\mathcal{I}\ \boldsymbol{\omega}=\lambda\;\boldsymbol{\omega}\,

也就是以下行列式等于零的的三次方程

{\displaystyle {\begin{vmatrix}I_{xx}-\lambda &I_{xy}&I_{xz}\\I_{yx}&I_{yy}-\lambda &I_{yz}\\I_{zx}&I_{zy}&I_{zz}-\lambda \end{vmatrix}}=0\,}\begin{vmatrix}I_{xx} - \lambda & I_{xy} & I_{xz} \\I_{yx} & I_{yy} - \lambda & I_{yz} \\I_{zx} & I_{zy} & I_{zz} - \lambda \end{vmatrix}=0\, 

这方程的三个根{\displaystyle \lambda _{1}\,}\lambda_1\,{\displaystyle \lambda _{2}\,}\lambda_2\,{\displaystyle \lambda _{3}\,}\lambda_3\,都是正实的特征值。将特征值代入特征方程,再加上方向余弦(directional cosine)方程,

{\displaystyle \omega _{x}^{2}+\omega _{y}^{2}+\omega _{z}^{2}=1\,}\omega_x^2+\omega_y^2+\omega_z^2=1\,。就可以求到特征向量{\displaystyle {\hat {\boldsymbol {\omega }}}_{1}\,}\hat{\boldsymbol{\omega}}_1\,{\displaystyle {\hat {\boldsymbol {\omega }}}_{2}\,}\hat{\boldsymbol{\omega}}_2\,{\displaystyle {\hat {\boldsymbol {\omega }}}_{3}\,}\hat{\boldsymbol{\omega}}_3\,。这些特征向量都是刚体的惯量主轴;而这些特征值则分别是刚体对于惯量主轴的主转动惯量

应力张量

固体力学中,应力张量是对称的,因而可以分解为对角张量,其特征值位于对角线上,而特征向量可以作为基。因为它是对角阵,在这个定向中,应力张量没有剪切分量;它只有主分量。

图的特征值

谱系图论中,一个的特征值定义为图的邻接矩阵A的特征值,或者(更多的是)图的拉普拉斯算子矩阵{\displaystyle I-T^{-1/2}AT^{-1/2}}I-T^{-1/2}AT^{-1/2},其中T是对角阵表示每个顶点的度数,在{\displaystyle T^{-1/2}}T^{-1/2}中,0用于取代{\displaystyle 0^{-1/2}}0^{-1/2}。图的主特征向量用于测量其顶点的中心度GooglePageRank算法就是一个例子。www图的修正邻接矩阵的主特征向量的分量给出了页面评分


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章