重溫矩陣(II) 特徵向量

     圖片

 

上一次我們說到將矩陣理解成線性變換很容易讓我們理解矩陣的各方面性質。這一次我們主要講一講研究矩陣特性的一個重要依據:特徵向量;

顧名思義,特徵向量就是矩陣的重要的特徵,就像我們日常理解的特徵一樣,它是事物與事物區分的依據,在數學裏面,特徵同樣有類似的意思,正所謂:

 

明白數學是變換是爲入門,明白數學是分類是爲進階

 

今天我們就正式的由入門階段而跨入認識數學的新一個層次了。在講之前我們先談一談以前我們對特徵向量的認識,大概學了線代之後大家對若干公式有很深的印象,最深者莫過於下式:

 

A*X = lambda*X

 

說來我對這個公式的認識不過於展開後得到一個方程,然後再解出lambda的值,至於其中的認識並不清楚。不過,不妨我們打開wiki百科,查看特徵向量這個詞條(我認爲這個詞條是至今爲止最棒的詞條!),我想看完之後大家一定豁然開朗的感覺,正如百科所說:

數學上,一個線性變換的一個特徵向量(本徵向量)是一個非退化向量,其方向在該線性變換的作用下仍保持與原方向保持在同一條線上(即可能會反向,如果特徵值爲負),而長度則可能改變。該向量在該線性變換下縮放的比例稱爲其特徵值(本徵值)。”

百科同時給出了一個我認爲是wiki百科最爲經典的實例:

 

圖片

 

上面就是鼎鼎大名被稱爲有史以來最聰明的人之一的達芬奇先生(港稱:達文西,看過周星馳的《國產凌凌漆》的同學一定有印象,注意不是達爾文)的名畫《蒙娜麗莎》,大家可以看到紅箭頭所代表的特徵方向在變換前後並沒有發生變化,而觀察藍色箭頭,在變換後有稍許偏移。於是我們稱紅箭頭所代表的向量爲:特徵向量

 

個人認爲這個一下子讓我愛上wiki百科的詞條的美中不足就是:這個圖示並不那麼的美觀和明顯,說實話,我是仔細比對一下,才發現藍箭頭的方向確實變化了,於是我決定發揮我們的創意,爲完善wiki 這項人類文明史上的最爲龐大的項目做些貢獻了。

 

我們說過達文西先生是個聰明人,爲了顯示他超越時代的想象力以及神乎其神的洞察力,我們看他的另一幅名畫(看過電影《天使與魔鬼》的同學一定非常熟悉):《施洗者聖約翰》,正是我們開篇所看到的。

圖片


我們採用的是變換矩陣:

A = [1 ,1/4

      0 ,  1]

對其進行變換的,這個矩陣正是上一次我們談到的錯切變換對應的矩陣了,這個矩陣的特性就是保持某一個軸不變,變化另一個軸,關於他的特性我們還會再次講解。

現在觀察變換前後的圖像:注意聖約翰的手指方向,在錯切變換前後並沒有改變其指向,爲了對比,我們觀察施洗者手指上方的十字架,很明顯:十字架的橫軸已經向水平方向發生了偏移。(約翰同學:看到了吧?!)

我們知道錯切變換是線性變換中的一種,因此,我們爲了說明線性變換正是一類特殊的變換(旋轉,反射,錯切,平移等等)的疊加,有必要展現更加普遍意義的效果。

我們考慮這樣一個問題:

如何操作,將聖約翰所指的十字架變成一個垂直的十字架呢?

建立我們的直觀認識,首先我們需要將偏轉的十字架旋轉到水平方向上,爲了做到這一點,大家先估計一下十字架的“水平軸”約與水平線差25度角,現在大家只需要構造一個旋轉矩陣完成將“水平軸”轉到水平線的操作:

 

R = [ cos(25) ,sin(25)

       -sin(25) ,cos(25)   ];

觀察我們得到的結果:

圖片

 

水平軸方向對了,不過垂直軸向卻偏了;考慮我們上文所說的錯切變換是改變一個方向而保持一個方向(那你怎麼不直接一次完成操作呢?呵呵),現在我們需要把“垂直軸”變回來,這並不難:一個錯切變換就可以完成:

E = [   1 ,0

1/2 ,1 ];

效果如下所示:

圖片

現在兩個軸已經垂直了,剩下的就是再做一個旋轉,至少得把我們的施洗者偏轉回來。這個難不倒我們,再做一個小的旋轉S即可完成。

圖片

總結以上過程,我們得到一個變換矩陣:

A = S*E*R;

如此,大家遇到問題,不妨試着基於直覺去構造想要的變換吧。

 

我重新翻閱了以前沒有學好的高等代數教材,對矩陣的理解又加深了一步。對於線性變換與矩陣來說,並不是一對一的關係,事實上,矩陣對應一個線性變換,而對於不同的基向量,線性變換對應於不同的矩陣。而我們常規使用的是單位正交基,因此至少造成了我對矩陣與線性變換一一對應關係的誤解。

讓我們接着上次的話題,上一次我們瞭解在二維平面上存在一系列的變換以及他們在單位正交基上對應的矩陣。對於不同的矩陣對我們的單位圓有不同的效果:首先我們可能意識到單位圓內有些方向在變換中變化了方向,而有時有一個或者兩個方向在變換中沒有變化,而變化的往往只是他們的長度,例如伸縮變換反映在二維平面上就是原先的單位圓發生形變,變成了橢圓,而原先的軸向不變,長度或增大,或減小成爲橢圓的長短軸。

其實,上述特徵是研究矩陣的重要依據。回顧我們以前提到的,數學關心在變換中不變的東西。對於矩陣我們稱這些方向不變(或者方向正好相反)的向量爲矩陣的特徵向量(稱他們爲本徵向量則更令我們瞭解他們的意義),而對於他們伸縮的比例,我們謂之特徵值。而用特徵向量以及特徵值去研究矩陣或者線性變換再好不過了。

回過頭來看,上文描述的那些變換都具有那些平面上的變換各有什麼樣的特徵向量以及特徵值。

對於反射:很簡單我們它將縱軸或者橫軸的矢量反向,但方向不變(或相反,即特徵值爲負),顯然他就有兩個特徵向量(特指)。

觀察旋轉變換:除了原點不變外,其他方向均發生了變化(扭轉),於是如有特徵向量的話,那麼他的特徵向量就是(0,0)了。

觀察錯切這種特殊的線性變化:其特徵向量自然保持了一個軸向不變(或反向),而其他的方向均發生了變化,故其特徵向量只有一個。 

 

我們在開篇時說過,矩陣也是這些基本線性變換的組合,因此看清這些變換的本質將有益於我們分析矩陣的特性;談到這裏,很多人就想:既然對於特徵向量來說,這些變換隻改變他們的長度而不改變他們的方向,那豈不是對於他們來說矩陣只充當伸縮的變換作用。即,我們矩陣對特徵向量本質上只進行伸縮變換。那麼,我們是不是可以通過經過某種變化將矩陣化成伸縮操作。

是的,我們看到伸縮矩陣的形式:對角,是最簡單不過的了,即只有對角線上的元素是非零的,這種形式的矩陣美觀而且利於運算和分析,更進一步其蘊含這很大的特徵:非對角線上的元爲零元表明對應的維之間沒有關係。這樣是不是很好?我們可以將這些維分開處理,而不必擔心他們之間或有相互的干擾。各位這就是數學的一大精髓,把複雜的問題分解成若干互不相干的子問題進行處理,處理相對簡單的子問題後將答案疊加構成原問題的解(滿足疊加原理的問題我們稱之爲線性的)

回到我們的問題中來,將矩陣對角化研究並不改變我們矩陣的原有性質(如行列式,這個問題可以參見wiki有很棒的解釋),而保留的這部分性質也正是矩陣最本質的,最終我們稱這些對應於同一線性變換的矩陣是相似的,他們的本質是一樣的:OK!變的只是形式。

 

正如我們上文所說,相似矩陣是同一線性變換在不同基下的不同形式。當然,現在你我一定思路清晰起來,我們能不能選擇合適的基,使這些矩陣都有一個很容易分析的形式,對角化。問題明朗化了,特徵向量的作用發揮了。

 

對於那些有兩個特徵方向(不相關的)的矩陣顯然是可以的,而對於那些只有一個特徵方向的變換,如錯切;以及那些只有零向量不變的變換,如旋轉,對角化顯然就不可能了,因爲我們瞭解只有一個向量或者零向量是無法擴展成爲一個平面的,換句話說他們構不成平面的一組基。

 

對於那些不能對角化的矩陣並不是無法進行簡單化了,我們仍然有些手段去簡單化他們,比如化爲若爾當型。這些我現在還不瞭解,就不說了。但做這些處理一般都離不開一個思想,即:去除變量間的耦合性,儘量的減小變量間的干擾。

 

特徵向量與特徵值的問題由此點出,而在不同的應用領域特徵向量又有不同的體現,但其刻畫矩陣性質的特性不變。想要了解更多可以看看wiki以及給我很大啓發和指導的Lin dahua 的博客。他們的講解都很透徹。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章