重温矩阵(II) 特征向量

     图片

 

上一次我们说到将矩阵理解成线性变换很容易让我们理解矩阵的各方面性质。这一次我们主要讲一讲研究矩阵特性的一个重要依据:特征向量;

顾名思义,特征向量就是矩阵的重要的特征,就像我们日常理解的特征一样,它是事物与事物区分的依据,在数学里面,特征同样有类似的意思,正所谓:

 

明白数学是变换是为入门,明白数学是分类是为进阶

 

今天我们就正式的由入门阶段而跨入认识数学的新一个层次了。在讲之前我们先谈一谈以前我们对特征向量的认识,大概学了线代之后大家对若干公式有很深的印象,最深者莫过于下式:

 

A*X = lambda*X

 

说来我对这个公式的认识不过于展开后得到一个方程,然后再解出lambda的值,至于其中的认识并不清楚。不过,不妨我们打开wiki百科,查看特征向量这个词条(我认为这个词条是至今为止最棒的词条!),我想看完之后大家一定豁然开朗的感觉,正如百科所说:

数学上,一个线性变换的一个特征向量(本征向量)是一个非退化向量,其方向在该线性变换的作用下仍保持与原方向保持在同一条线上(即可能会反向,如果特征值为负),而长度则可能改变。该向量在该线性变换下缩放的比例称为其特征值(本征值)。”

百科同时给出了一个我认为是wiki百科最为经典的实例:

 

图片

 

上面就是鼎鼎大名被称为有史以来最聪明的人之一的达芬奇先生(港称:达文西,看过周星驰的《国产凌凌漆》的同学一定有印象,注意不是达尔文)的名画《蒙娜丽莎》,大家可以看到红箭头所代表的特征方向在变换前后并没有发生变化,而观察蓝色箭头,在变换后有稍许偏移。于是我们称红箭头所代表的向量为:特征向量

 

个人认为这个一下子让我爱上wiki百科的词条的美中不足就是:这个图示并不那么的美观和明显,说实话,我是仔细比对一下,才发现蓝箭头的方向确实变化了,于是我决定发挥我们的创意,为完善wiki 这项人类文明史上的最为庞大的项目做些贡献了。

 

我们说过达文西先生是个聪明人,为了显示他超越时代的想象力以及神乎其神的洞察力,我们看他的另一幅名画(看过电影《天使与魔鬼》的同学一定非常熟悉):《施洗者圣约翰》,正是我们开篇所看到的。

图片


我们采用的是变换矩阵:

A = [1 ,1/4

      0 ,  1]

对其进行变换的,这个矩阵正是上一次我们谈到的错切变换对应的矩阵了,这个矩阵的特性就是保持某一个轴不变,变化另一个轴,关于他的特性我们还会再次讲解。

现在观察变换前后的图像:注意圣约翰的手指方向,在错切变换前后并没有改变其指向,为了对比,我们观察施洗者手指上方的十字架,很明显:十字架的横轴已经向水平方向发生了偏移。(约翰同学:看到了吧?!)

我们知道错切变换是线性变换中的一种,因此,我们为了说明线性变换正是一类特殊的变换(旋转,反射,错切,平移等等)的叠加,有必要展现更加普遍意义的效果。

我们考虑这样一个问题:

如何操作,将圣约翰所指的十字架变成一个垂直的十字架呢?

建立我们的直观认识,首先我们需要将偏转的十字架旋转到水平方向上,为了做到这一点,大家先估计一下十字架的“水平轴”约与水平线差25度角,现在大家只需要构造一个旋转矩阵完成将“水平轴”转到水平线的操作:

 

R = [ cos(25) ,sin(25)

       -sin(25) ,cos(25)   ];

观察我们得到的结果:

图片

 

水平轴方向对了,不过垂直轴向却偏了;考虑我们上文所说的错切变换是改变一个方向而保持一个方向(那你怎么不直接一次完成操作呢?呵呵),现在我们需要把“垂直轴”变回来,这并不难:一个错切变换就可以完成:

E = [   1 ,0

1/2 ,1 ];

效果如下所示:

图片

现在两个轴已经垂直了,剩下的就是再做一个旋转,至少得把我们的施洗者偏转回来。这个难不倒我们,再做一个小的旋转S即可完成。

图片

总结以上过程,我们得到一个变换矩阵:

A = S*E*R;

如此,大家遇到问题,不妨试着基于直觉去构造想要的变换吧。

 

我重新翻阅了以前没有学好的高等代数教材,对矩阵的理解又加深了一步。对于线性变换与矩阵来说,并不是一对一的关系,事实上,矩阵对应一个线性变换,而对于不同的基向量,线性变换对应于不同的矩阵。而我们常规使用的是单位正交基,因此至少造成了我对矩阵与线性变换一一对应关系的误解。

让我们接着上次的话题,上一次我们了解在二维平面上存在一系列的变换以及他们在单位正交基上对应的矩阵。对于不同的矩阵对我们的单位圆有不同的效果:首先我们可能意识到单位圆内有些方向在变换中变化了方向,而有时有一个或者两个方向在变换中没有变化,而变化的往往只是他们的长度,例如伸缩变换反映在二维平面上就是原先的单位圆发生形变,变成了椭圆,而原先的轴向不变,长度或增大,或减小成为椭圆的长短轴。

其实,上述特征是研究矩阵的重要依据。回顾我们以前提到的,数学关心在变换中不变的东西。对于矩阵我们称这些方向不变(或者方向正好相反)的向量为矩阵的特征向量(称他们为本征向量则更令我们了解他们的意义),而对于他们伸缩的比例,我们谓之特征值。而用特征向量以及特征值去研究矩阵或者线性变换再好不过了。

回过头来看,上文描述的那些变换都具有那些平面上的变换各有什么样的特征向量以及特征值。

对于反射:很简单我们它将纵轴或者横轴的矢量反向,但方向不变(或相反,即特征值为负),显然他就有两个特征向量(特指)。

观察旋转变换:除了原点不变外,其他方向均发生了变化(扭转),于是如有特征向量的话,那么他的特征向量就是(0,0)了。

观察错切这种特殊的线性变化:其特征向量自然保持了一个轴向不变(或反向),而其他的方向均发生了变化,故其特征向量只有一个。 

 

我们在开篇时说过,矩阵也是这些基本线性变换的组合,因此看清这些变换的本质将有益于我们分析矩阵的特性;谈到这里,很多人就想:既然对于特征向量来说,这些变换只改变他们的长度而不改变他们的方向,那岂不是对于他们来说矩阵只充当伸缩的变换作用。即,我们矩阵对特征向量本质上只进行伸缩变换。那么,我们是不是可以通过经过某种变化将矩阵化成伸缩操作。

是的,我们看到伸缩矩阵的形式:对角,是最简单不过的了,即只有对角线上的元素是非零的,这种形式的矩阵美观而且利于运算和分析,更进一步其蕴含这很大的特征:非对角线上的元为零元表明对应的维之间没有关系。这样是不是很好?我们可以将这些维分开处理,而不必担心他们之间或有相互的干扰。各位这就是数学的一大精髓,把复杂的问题分解成若干互不相干的子问题进行处理,处理相对简单的子问题后将答案叠加构成原问题的解(满足叠加原理的问题我们称之为线性的)

回到我们的问题中来,将矩阵对角化研究并不改变我们矩阵的原有性质(如行列式,这个问题可以参见wiki有很棒的解释),而保留的这部分性质也正是矩阵最本质的,最终我们称这些对应于同一线性变换的矩阵是相似的,他们的本质是一样的:OK!变的只是形式。

 

正如我们上文所说,相似矩阵是同一线性变换在不同基下的不同形式。当然,现在你我一定思路清晰起来,我们能不能选择合适的基,使这些矩阵都有一个很容易分析的形式,对角化。问题明朗化了,特征向量的作用发挥了。

 

对于那些有两个特征方向(不相关的)的矩阵显然是可以的,而对于那些只有一个特征方向的变换,如错切;以及那些只有零向量不变的变换,如旋转,对角化显然就不可能了,因为我们了解只有一个向量或者零向量是无法扩展成为一个平面的,换句话说他们构不成平面的一组基。

 

对于那些不能对角化的矩阵并不是无法进行简单化了,我们仍然有些手段去简单化他们,比如化为若尔当型。这些我现在还不了解,就不说了。但做这些处理一般都离不开一个思想,即:去除变量间的耦合性,尽量的减小变量间的干扰。

 

特征向量与特征值的问题由此点出,而在不同的应用领域特征向量又有不同的体现,但其刻画矩阵性质的特性不变。想要了解更多可以看看wiki以及给我很大启发和指导的Lin dahua 的博客。他们的讲解都很透彻。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章