線性代數及其應用:第五章 特徵值與特徵向量


  前言:這篇blog是《Linear Algebra and Its Applications》第五章的一些學習筆記。

第五章 特徵值與特徵向量

1.特徵值與特徵向量

  對方陣An×nA_{n\times n},其特徵方程表示爲Ax=λx   (x0)Ax=\lambda x~~~(x \neq 0)其中λ\lambda是標量,也叫特徵值(特徵根,本徵值),xx是向量,也叫特徵向量。

  其幾何意義:特徵向量的方向是一個特殊的方向,在這個方向上進行矩陣AA的線性變換,等於在這個方向伸縮λ\lambda倍。

  方陣一定有特徵值,因爲方陣的特徵多項式在複數域內一定能分解成一次因式,但是方陣不一定有實特徵值

1.1. 求解特徵值與特徵向量

  求解(AλI)x=0(A-\lambda I)x=0要求xxAλIA-\lambda I的零空間上,所以零空間不爲0,所以det(AλI)=0det(A-\lambda I)=0求解該方程即可得到特徵值λ\lambda,把λ\lambda代回(AλI)x=0(A-\lambda I)x=0求解該方程得到特徵向量xx

1.2. 性質

  假設An×n={aij}A_{n \times n}=\{a_{ij}\}有特徵值λn\lambda_{n}與特徵向量xnx_{n},則a11λ  aij a22λ     aij  annλ=(λ1λ)(λ2λ)(λnλ)\left | \begin{matrix} a_{11}-\lambda & ~ & ~ & a_{ij} \\ ~ & a_{22}-\lambda & ~ & ~ \\ ~ & ~ & \dots & ~ \\ a_{ij} & ~ & ~ & a_{nn}-\lambda \\ \end{matrix}\right | =(\lambda_{1}-\lambda)(\lambda_{2}-\lambda)\dots (\lambda_{n}-\lambda)

下面證明性質會用到上式。

性質一:λ1λ2λ3λn=det(A)\lambda_{1}·\lambda_{2}·\lambda_{3}\dots\lambda_{n}=det(A)
證明:把λ=0\lambda=0代入上式即可證明。

性質二:λ1+λ2+λ3++λn=Tr(A)=a11+a22++ann\lambda_{1}+\lambda_{2}+\lambda_{3}+\dots+\lambda_{n}=Tr(A)=a_{11}+a_{22}+\dots +a_{nn}
證明:假設把上式等號左右展開,看λn1\lambda^{n-1}項的係數,左邊=(1)n1(a11+a22++ann)λn1=(-1)^{n-1}(a_{11}+a_{22}+\dots +a_{nn})\lambda^{n-1}=右邊=(1)n1(λ1+λ2++λn)λn1(-1)^{n-1}(\lambda_{1}+\lambda_{2}+\dots +\lambda_{n})\lambda^{n-1},證畢。

性質三:f(A)f(A)的特徵值是f(λi)f(\lambda_{i})f()f(·)是多項式函數
證明:f(A)=anAn+an1An1++a1A+a0f(A)=a_{n}A^{n}+a_{n-1}A^{n-1}+\dots +a_{1}A+a_{0}兩邊右乘特徵向量xx
f(A)x=anAnx+an1An1x++a2A2x+a1Ax+a0x=anλAn1x+an1λAn2x++a2λAx+a1λx+a0x=anλ2An2x+an1λ2An3x++a2λ2x+a1λx+a0x=anλnx+an1λn1x++a2λ2x+a1λx+a0x=f(λ)x\begin{aligned} f(A)x & =a_{n}A^{n}x+a_{n-1}A^{n-1}x+\dots +a_{2}A^{2}x+a_{1}Ax+a_{0}x \\ & = a_{n}\lambda A^{n-1}x+a_{n-1}\lambda A^{n-2}x+\dots +a_{2}\lambda Ax+a_{1}\lambda x+a_{0}x \\ & = a_{n}\lambda^{2} A^{n-2}x+a_{n-1}\lambda^{2} A^{n-3}x+\dots +a_{2}\lambda^{2}x+a_{1}\lambda x+a_{0}x \\ & \dots \\ & = a_{n}\lambda^{n}x+a_{n-1}\lambda^{n-1}x+\dots +a_{2}\lambda^{2}x+a_{1}\lambda x+a_{0}x \\ & = f(\lambda)x \end{aligned}

性質四:不同特徵根對應特徵向量一定線性無關。
證明:設λ1\lambda_{1}的一個特徵向量x1x_{1}λ2\lambda_{2}的一個特徵向量x2x_{2}λ1λ2\lambda_{1} \neq \lambda_{2}
(1)c1x1+c2x2=0c_{1}x_{1}+c_{2}x_{2}=0\tag{1}(1)左乘A得(2)c1Ax1+c2Ax2=c1λ1x1+c2λ2x2=0c_{1}Ax_{1}+c_{2}Ax_{2}=c_{1}\lambda_{1}x_{1}+c_{2}\lambda_{2}x_{2}=0\tag{2}

(1)左乘λ1\lambda_{1}(3)c1λ1x1+c2λ1x2=0c_{1}\lambda_{1}x_{1}+c_{2}\lambda_{1}x_{2}=0 \tag{3}

(2)-(3)得c2(λ2λ1)x2=0c_{2}(\lambda_{2}-\lambda_{1})x_{2}=0,由於λ2λ1\lambda_{2}\neq \lambda_{1}x20x_{2}\neq 0,故c2=0c_{2}=0,重複上面方法,消去c2c_{2},可得c1=0c_{1}=0,故(1)式子成立一定有c1=c2=0c_{1}=c_{2}=0,所以x1,x2x_{1},x_{2}線性無關。

性質五:Hamilton-Cayley定理,設f(λ)=λEA=λn+b1λn1++bn1λ+bnf(\lambda)=|\lambda E-A|=\lambda^{n}+b_{1}\lambda^{n-1}+\dots +b_{n-1}\lambda+b_{n}f(A)=λEA=An+b1An1++bn1A+bnE=0f(A)=|\lambda E-A|=A^{n}+b_{1}A^{n-1}+\dots +b_{n-1}A+b_{n}E=0

2. 特徵值分解

2.1. 特徵值分解:

  設AA的特徵值爲λn\lambda_{n},特徵向量爲xnx_{n},令Λ=[λ1  0 λ2     0  λn]\Lambda =\left [ \begin{matrix} \lambda_{1} & ~ & ~ & 0 \\ ~ & \lambda_{2} & ~ & ~ \\ ~ & ~ & \dots & ~ \\ 0 & ~ & ~ & \lambda_{n} \\ \end{matrix} \right ]

S=[ x1x2xn ]S=\left [ \begin{matrix} | & | & ~ & | \\ x_{1} & x_{2} & \dots & x_{n} \\ | & | & ~ & | \\ \end{matrix} \right ]

AS=(Ax1,Ax2,,Axn)=(λ1x1,λ2x2,,λnxn)=SΛ\begin{aligned} A·S & =(A·x_{1}, A·x_{2}, \dots ,A·x_{n}) \\ & = (\lambda_{1} ·x_{1}, \lambda_{2} ·x_{2}, \dots ,\lambda_{n} ·x_{n})=S·\Lambda \end{aligned}

如果SS可逆,則A=SΛS1A=S \Lambda S^{-1}

這就把AA矩陣分解成對角矩陣,但是要求SS可逆,等價於要求SS的列向量線性無關,等價於要求 AA至少有n個線性無關的特徵向量,我們需要把這nn個線性無關的特徵向量放到SS的列向量。

  根據1.2.的性質四,我們知道不同特徵根的特徵向量一定線性無關,所以如果我們知道AAnn個不同的特徵根λ\lambda,則A一定可以進行特徵值分解,若存在特徵根一樣的情況,特徵向量是否線性無關要具體分析,也有可能有n個線性無關的特徵向量,例如下面的矩陣就可以進行特徵值分解。[000000000]\left [ \begin{matrix} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \\ \end{matrix} \right ] 下面的矩陣不可以進行特徵值分解。
[010000000][010001000]\left [ \begin{matrix} 0 & 1 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \\ \end{matrix} \right ] \left [ \begin{matrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \\ \end{matrix} \right ]

如果你知道Jordan標準型(後面會講),就會很清楚這一點。

2.2. 特徵值分解應用:差分方程

  如果AA可以進行特徵值分解A=SΛS1A=S\Lambda S^{-1},則AK=SΛkS1A^{K}=S\Lambda^{k} S^{-1}Λ\Lambda是對角矩陣,所以其k次方就是對角線元素分別取k次方。
  知道這個前提後,假設我們要求解斐波那契數列,Fk=Fk+1+Fk+2,F0=0,F1=1F_{k}=F_{k+1}+F_{k+2},F_{0}=0,F_{1}=1,如果我們想求FnF_{n}的值,構造uk=(Fk+1Fk)u_{k}=\left ( \begin{matrix} F_{k+1} \\ F_{k} \end{matrix} \right )uk+1=(Fk+2Fk+1)=(Fk+1+FkFk+1)=(1110)(Fk+1Fk)=Auku_{k+1}=\left ( \begin{matrix} F_{k+2} \\ F_{k+1} \end{matrix} \right ) = \left ( \begin{matrix} F_{k+1} +F_{k}\\ F_{k+1} \end{matrix} \right ) = \left ( \begin{matrix} 1 & 1\\ 1 & 0 \end{matrix} \right ) \left ( \begin{matrix} F_{k+1}\\ F_{k} \end{matrix} \right )=A·u_{k}

所以uk=Auk1=A2uk2==Aku0=SΛkS1u0u_{k}=Au_{k-1}=A^{2}u_{k-2}=\dots=A^{k}u_{0}=S\Lambda^{k}S^{-1}u_{0}其中u0=(F1F0)=(10)u_{0}=\left ( \begin{matrix} F_{1}\\ F_{0} \end{matrix} \right )=\left ( \begin{matrix} 1\\ 0 \end{matrix} \right )我們在求得un=SΛnS1u0u_{n}=S\Lambda^{n}S^{-1}u_{0}後,取unu_{n}的第二個元素即是FnF_{n}的值。

2.2.1. 重要差分方程:Markov方陣

  如果AA是Markov方陣(狀態轉移矩陣),則A={aij}n×nA=\{a_{ij}\}_{n\times n}滿足,i=1naik=10aik1\sum\limits_{i=1}^{n}a_{ik}=1,0\leq a_{ik} \geq 1aija_{ij}表示從狀態jj轉移到狀態ii的轉移概率。以二階爲例,假如我們知道一個初始狀態[X0Y0]\left [ \begin{matrix} X_{0} \\ Y_{0} \end{matrix} \right ]

且知道Markov方陣(狀態轉移矩陣)A=[a00a01a10a11]A = \left [ \begin{matrix} a_{00} & a_{01} \\ a_{10} & a_{11} \end{matrix} \right ]則我們可以知道下一時刻的狀態爲:A[X0Y0]=[a00a01a10a11][X0Y0]=[X0a00+Y0a01Y0a10+Y0a11]=[X1Y1]A \left [ \begin{matrix} X_{0} \\ Y_{0} \end{matrix} \right ] = \left [ \begin{matrix} a_{00} & a_{01} \\ a_{10} & a_{11} \end{matrix} \right ]\left [ \begin{matrix} X_{0} \\ Y_{0} \end{matrix} \right ] = \left [ \begin{matrix} X_{0}a_{00} +Y_{0}a_{01}\\ Y_{0}a_{10} +Y_{0}a_{11} \end{matrix} \right ] = \left [ \begin{matrix} X_{1} \\ Y_{1} \end{matrix} \right ]

具體例子可以看blog,這樣能夠更好理解,這裏暫時不講。

  Markov方陣一定有特徵根1,且λ=1\lambda=1對應穩態,λ<1\lambda<1對應暫態,如果λ=1\lambda=1是重根,則有多個穩態,最終的穩態是是這些穩態的線性組合。

2.3. 特徵值分解應用:微分方程

  對於帶有方陣的微分方程ut=Au\frac{\partial u}{\partial t} = Au注意這裏的方陣A是作爲係數,和對矩陣求導不一樣。如果我們要求的是不帶方陣的,我們知道的微分方程yx=ay\frac{\partial y}{\partial x} = ay,則我們可以猜到結果是y=ceaxy= c·e^{ax}cc是常數,同理我們猜測帶有方陣的微分方程的解是u(t)=eAtu(0)u(t)=e^{At}·u(0),向量u(0)u(0)是一個初值,和常數cc的作用類似,我們對eAte^{At}進行泰勒展開(矩陣的很多運算可以類比標量的運算,但不是全部,泰勒展開就是可以類比的)eAt=I+At+(At)22!+(At)33!+=S(I+Λt+(Λt)22!+(Λt)33!+ )S1=SeΛtS1=S[eλ1t0eλ2t0eλnt]S1\begin{aligned} e^{At} & =I+At+\frac{(At)^{2}}{2!}+\frac{(At)^{3}}{3!}+\dots \\ & = S(I+\Lambda t+\frac{(\Lambda t)^{2}}{2!}+\frac{(\Lambda t)^{3}}{3!}+\dots)S^{-1} \\ & = Se^{\Lambda t}S^{-1} \\ & = S \left [\begin{matrix} e^{\lambda_{1}t} & & & 0\\ & e^{\lambda_{2}t} & & \\ & & \dots & \\ 0 & & & e^{\lambda_{n}t} \\ \end{matrix} \right ]S^{-1} \end{aligned}

所以微分方程的解是u(t)=SeΛtS1u(0)=i=1Ncieλtxiu(t)=Se^{\Lambda t}S^{-1} u(0)=\sum \limits_{i=1}^{N}c_{i}e^{\lambda t}x_{i}

其中c=S1u(0)c=S^{-1}u(0)cic_{i}cc的第ii個元素,xix_{i}SS中第ii個列向量,也是λi\lambda_{i}對應的特徵向量。

例如我們想求解微分方程y3y+2y=0y'''-3y''+2y'=0則我們可以構造如下的矩陣微分方程u=[yyy]=[320100010][yyy]=Auu'=\left [ \begin{matrix} y''' \\ y'' \\ y' \end{matrix} \right ]=\left [ \begin{matrix} 3 & -2 & 0 \\ 1 & 0 & 0 \\ 0 & 1 & 0 \end{matrix} \right ]\left [ \begin{matrix} y'' \\ y'\\ y \end{matrix} \right ]=Au

  我們進一步討論微分方程,在tt\rightarrow \infty時的穩定性,我們知道微分方程的解可以表示成u(t)=i=1Ncieλtxi=c1eλtx1+c2eλtx2+cneλtxnu(t)=\sum \limits_{i=1}^{N}c_{i}e^{\lambda t}x_{i}=c_{1}e^{\lambda t}x_{1}+c_{2}e^{\lambda t}x_{2}+\dots c_{n}e^{\lambda t}x_{n}。所以微分方程的解有如下三種情況:
情況一:如果所有λi\lambda_{i}的實部小於00,則u(t)u(t)穩定到00
情況二:如果λ1\lambda_{1}的實部等於00,其餘λi\lambda_{i}的實部小於00,則u(t)u(t)穩定到c1x1c_{1}x_{1}
情況三:如果任一λi\lambda_{i}的實部大於00,則u(t)u(t)發散;

  特別的,對於2×22\times 2方陣AA,由於其特徵方程det(AλI)=λ2Trace(A)λ+det(A)det(A-\lambda I)=\lambda^{2}-Trace(A)\lambda + det(A)

要求其跡Trace(A)<0Trace(A)<0,行列式det(A)>0det(A)>0AA構成的微分方程ut=Au\frac{\partial u}{\partial t} = Au的解才穩定。

3. 複數矩陣

  複數矩陣就是元素含有複數的矩陣。在複數域,相當於把實數域的轉置T操作,變成了複數域的厄米H操作,厄米操作就是對矩陣求共軛轉置。

  類比轉置操作,厄米操作有如下性質:
性質一:如果復向量x,yx,y正交,則xHy=0x^{H}y=0
性質二:復向量內積,x2=xHx=x12+x12+||x||^{2}=x^{H}x=|x_{1}|^{2}+|x_{1}|^{2}+\dots
性質三:對復矩陣A,BA,B,則(AB)H=BHAH(AB)^{H} = B^{H}A^{H}

  複數矩陣最有名的應用,就是FFT(快速傅里葉變換)。

3.1. 三個典型的複數矩陣

  複數域:厄米矩陣A: A=AHA=A^{H},反厄米矩陣A: A=AHA=-A^{H},酉矩陣U: UUH=IUU^{H}=I

  對應實數域:實對稱矩陣A: A=ATA=A^{T},反實對稱矩陣A: A=ATA=-A^{T},正交矩陣Q: QQT=IQQ^{T}=I

4. 相似變換

  對於方陣A,BA,B,如果存在可逆矩陣MM,使得B=M1AMB=M^{-1}AM則稱方陣BB與方陣AA相似,從AABB的變換稱爲相似變換。

  如果A,BA,B相似,則A,BA,B有相同的特徵值,如果同時AA有特徵向量XX,則對應的BB有特徵向量M1XM^{-1}X。證明如下:AX=λXA=MBM1AX=\lambda X,且A=MBM^{-1}MBM1X=λXMBM^{-1}X=\lambda X所以B(M1X)=λ(M1X)B(M^{-1}X)=\lambda (M^{-1}X)證畢。

  可以說,相似變換把n×nn\times n矩陣空間分割成若干子空間,每個子空間可以當做一個類別,子空間內部矩陣相似,因爲相似是可以傳遞的。相似的矩陣有相同的Jordan標準型。第二章中,我們已經證明,如果我們給定線性變換前後,兩個向量空間的基,則這個線性變換可以用矩陣表示,特殊的,如果我們的矩陣是方陣,那麼線性變換其實是在一個向量空間內部,針對同一組基的變換。下面我們會證明,相似的矩陣其實是同一個線性變換,只不過選定的基不同

證明:假設我們有相似變換B=M1AMB=M^{-1}AM

我們的線性變換是A~\widetilde{A},原先的基是[u1,u2un][u_{1}, u_{2}\dots u_{n}],則A~([u1,u2un])=[u1,u2un]A\widetilde{A}([u_{1}, u_{2}\dots u_{n}])=[u_{1}, u_{2}\dots u_{n}]A

新的基[v1,v2vn][v_{1}, v_{2}\dots v_{n}]與原先的基有變換[v1,v2vn]=[u1,u2un]M[v1,v2vn]M1=[u1,u2un][v_{1}, v_{2}\dots v_{n}]=[u_{1}, u_{2}\dots u_{n}]M \\ 則[v_{1}, v_{2}\dots v_{n}]M^{-1}=[u_{1}, u_{2}\dots u_{n}]

那麼我們把線性變換作用到新的vv基有A~([v1,v2vn])=A~([u1,u2un]M)=A~([u1,u2un])M=[u1,u2un]AM=[v1,v2vn]M1AM=[v1,v2vn]B\begin{aligned} \widetilde{A}([v_{1}, v_{2}\dots v_{n}]) & =\widetilde{A}([u_{1}, u_{2}\dots u_{n}]M) \\ & = \widetilde{A}([u_{1}, u_{2}\dots u_{n}])M \\ & = [u_{1}, u_{2}\dots u_{n}]AM \\ & = [v_{1}, v_{2}\dots v_{n}]M^{-1}AM \\ & = [v_{1}, v_{2}\dots v_{n}]B \\ \end{aligned}

所以,針對線性變換A~\widetilde{A},如果我們限定變換前後的基爲uu基,則該線性變換可以用矩陣AA表示;如果我們限定變換前後的基爲vv基,則該線性變換可以用矩陣BB表示。

證畢。

4.1. 矩陣相似的應用

  我們可以利用矩陣相似變換,把矩陣變成對角矩陣,以方便我們的進一步求解。

4.1.1 解微分方程

  求解微分方程dudt=Au\frac{du}{dt}=Au

如果我們知道矩陣AA對角相似矩陣BB,滿足B=M1AMB=M^{-1}AM

則我們可以求得vv滿足u=Mvu=Mv,則Mdvdt=AMvM\frac{dv}{dt}=AMv進一步化簡得

dvdt=M1AMv=Bv\frac{dv}{dt}=M^{-1}AMv=Bv

由於BB是對角矩陣,我們可以輕易求得vv的取值,進而求得uu的值。

4.1.2 解差分方程

  求解差分方程uk+1=Auku_{k+1}=Au_{k}

如果我們知道矩陣AA對角相似矩陣BB,滿足B=M1AMB=M^{-1}AM

則我們可以求得vv滿足u=Mvu=Mv,則Mvk+1=AMvkMv_{k+1}=AMv_{k}進一步化簡得

vk+1=M1AMvk=Bvkv_{k+1}=M^{-1}AMv_{k}=Bv_{k}

由於BB是對角矩陣,我們可以輕易求得vv,進而求得uu的值。

4.2. 矩陣分解

  對於任意方陣AA,一定有復特徵值,可以被酉矩陣UU分解爲上三角形式U1AU=TU^{-1}AU=T,證明過程較爲麻煩,下面以A4×4A_{4 \times 4}爲例進行證明。

證明:
  Ax1=λ1x1Ax_{1}=\lambda_{1} x_{1}λ1\lambda_{1}AA的特徵值,x1x_{1}爲特徵向量。

  對x1x_{1}進行單位化,得到q1q_{1}同樣滿足Aq1=λ1q1Aq_{1}=\lambda_{1}q_{1}

  找到一組線性無關的向量q1,b,c,dq_{1}, b, c, d,對其進行施密特正交化法得到q1,q2,q3,q4q_{1},q_{2},q_{3},q_{4}

  構造酉矩陣U1=[q1,q2,q3,q4]U_{1}=[q_{1},q_{2},q_{3},q_{4}],則AU1=[Aq1,Aq2,Aq3,Aq4]=[λ1q1,Aq2,Aq3,Aq4]AU_{1}=[Aq_{1},Aq_{2},Aq_{3},Aq_{4}]=[\lambda_{1}q_{1},Aq_{2},Aq_{3},Aq_{4}]

  則U11AU1=U11[λ1q1,Aq2,Aq3,Aq4]=U1H[λ1q1,Aq2,Aq3,Aq4]=[q1Hq2Hq3Hq4H][λ1q1,Aq2,Aq3,Aq4]=[λ1000]=[λ100F3×30]\begin{aligned} U_{1}^{-1}AU_{1} & =U_{1}^{-1}[\lambda_{1}q_{1},Aq_{2},Aq_{3},Aq_{4}] \\ & = U_{1}^{H}[\lambda_{1}q_{1},Aq_{2},Aq_{3},Aq_{4}] \\ & = \left [ \begin{matrix} q_{1}^{H} \\ q_{2}^{H} \\ q_{3}^{H} \\ q_{4}^{H} \end{matrix}\right ] \left [ \begin{matrix} \lambda_{1}q_{1},Aq_{2},Aq_{3},Aq_{4} \end{matrix}\right ] \\ & = \left [ \begin{matrix} \lambda_{1} & * & * & * \\ 0 & * & * & * \\ 0 & * & * & * \\ 0 & * & * & * \end{matrix}\right ] \\ & = \left [ \begin{matrix} \lambda_{1} & * & * & * \\ 0 & & & \\ 0 & & F_{3 \times 3} & \\ 0 & & & \end{matrix}\right ] \end{aligned}

*表示未知值,也就是我們暫時不關心其取值,對右下角F3×3F_{3 \times 3}矩陣,我們繼續進行上面的操作,設Fq1=λ2q1Fq'_{1}=\lambda_{2}q'_{1},利用施密特正交化法找到q2,q3q'_{2},q'_{3},設U2=[100000q1q2q30]U_{2}=\left [ \begin{matrix} 1 & 0 & 0 & 0 \\ 0 & & & \\ 0 & q'_{1} & q'_{2} & q'_{3}\\ 0 & & & \end{matrix}\right ]

  則(U1AU11)U2=[λ100F3×30][100000q1q2q30]=[λ100Fq1Fq2Fq30]=[λ100λ2q1Fq2Fq30]\begin{aligned} (U_{1}AU_{1}^{-1})U_{2} & = \left [ \begin{matrix} \lambda_{1} & * & * & * \\ 0 & & & \\ 0 & & F_{3 \times 3} & \\ 0 & & & \end{matrix}\right ] \left [ \begin{matrix} 1 & 0 & 0 & 0 \\ 0 & & & \\ 0 & q'_{1} & q'_{2} & q'_{3}\\ 0 & & & \end{matrix}\right ] \\ & = \left [ \begin{matrix} \lambda_{1} & * & * & * \\ 0 & & & \\ 0 & Fq'_{1} & Fq'_{2} & Fq'_{3}\\ 0 & & & \end{matrix}\right ] \\ & = \left [ \begin{matrix} \lambda_{1} & * & * & * \\ 0 & & & \\ 0 & \lambda_{2}q'_{1} & Fq'_{2} & Fq'_{3}\\ 0 & & & \end{matrix}\right ] \\ \end{aligned}

其中,第二個等號的求解利用了矩陣的分塊乘法。又有U21=[10000q1H0q2H0q3H]=U2HU_{2}^{-1}=\left [ \begin{matrix} 1 & 0 & 0 & 0 \\ 0 & & q_{1}^{'H} & \\ 0 & & q_{2}^{'H} & \\ 0 & & q_{3}^{'H} & \end{matrix}\right ]=U_{2}^{H}

  所以U21(U1AU11)U2=[10000q1H0q2H0q3H][λ100λ2q1Fq2Fq30]=[λ10λ20000F2×2]\begin{aligned} U_{2}^{-1}(U_{1}AU_{1}^{-1})U_{2} & =\left [ \begin{matrix} 1 & 0 & 0 & 0 \\ 0 & & q_{1}^{'H} & \\ 0 & & q_{2}^{'H} & \\ 0 & & q_{3}^{'H} & \end{matrix}\right ] \left [ \begin{matrix} \lambda_{1} & * & * & * \\ 0 & & & \\ 0 & \lambda_{2}q'_{1} & Fq'_{2} & Fq'_{3}\\ 0 & & & \end{matrix}\right ] \\ & =\left [ \begin{matrix} \lambda_{1} & * & * & * \\ 0 & \lambda_{2} & * & * \\ 0 & 0 & & \\ 0 & 0 & & F'_{2\times 2} \end{matrix}\right ] \end{aligned}

  繼續對右下角的F2×2F'_{2\times 2}進行上述操作,找到U3,U4U_{3},U_{4}以及λ3,λ4\lambda_{3},\lambda_{4},則存在U=U1U2U3U4U=U_{1}U_{2}U_{3}U_{4}使得U1AU=[λ10λ200λ3000λ4]U^{-1}AU =\left [ \begin{matrix} \lambda_{1} & * & * & * \\ 0 & \lambda_{2} & * & * \\ 0 & 0 & \lambda_{3}& * \\ 0 & 0 & 0 & \lambda_{4} \end{matrix}\right ]

  若AA特徵向量與特徵根爲實數,則酉矩陣UU簡化爲正交矩陣QQ

4.3. Normal矩陣

  normal矩陣NN,滿足NHN=NNHN^{H}N=NN^{H},下面介紹六個基本normal矩陣。

  實數域:實對稱矩陣A: A=ATA=A^{T},反實對稱矩陣A: A=ATA=-A^{T},正交矩陣Q: QQT=IQQ^{T}=I

  複數域:厄米矩陣A: A=AHA=A^{H},反厄米矩陣A: A=AHA=-A^{H},酉矩陣U: UUH=IUU^{H}=I

  注意實數域與複數域是對應的。

  當然不只有上面幾種normal矩陣,利用分塊的性質,我們還可以輕鬆地構造,例如下面的矩陣也是normal矩陣[Q00A]\left[ \begin{matrix} Q & 0 \\ 0 & A\end{matrix} \right ]

  normal矩陣的特殊之處在於,如果對normal矩陣進行4.2. 介紹的矩陣分解,我們得到的會是對角矩陣,即U1NU=T=DU^{-1}NU=T=D,下面簡單證明。

證明:
TTH=U1NUUHNHU=U1NNHU=U1NHNU=UHNHUUHNU=(UHNU)HUHNU=THT\begin{aligned} TT^{H} & =U^{-1}NU·U^{H}N^{H}U \\ & = U^{-1}NN^{H}U \\ & = U^{-1}N^{H}NU \\ & = U^{H}N^{H}U·U^{H}NU \\ & = (U^{H}NU)^{H}·U^{H}NU \\ & = T^{H}T \end{aligned}

  所以TT也是normal矩陣,對於一個normal矩陣,如是上三角矩陣,一定也是對角矩陣。證畢。

4.4. 譜定理(spectral thorem)

  我瞭解譜定理是從矩陣分解的角度瞭解的,感覺不是很徹底,這部分可能問題較大,可以不看。
  譜定理是4.2的矩陣分解,針對實對稱矩陣的特殊形式。實對稱矩陣可以被分解成QΛQTQ\Lambda Q^{T}Λ\Lambda是特徵根對角矩陣(可重複),QQ是正交的特徵向量方陣。

  注意譜定理A=QΛQTA=Q\Lambda Q^{T}與特徵值分解A=SΛS1A=S\Lambda S^{-1}不同,特徵值分解要求SS列向量線性無關,譜定理要求QQ列向量單位正交,注意線性無關不一定正交,例如[1,1,0][1,1,0][1,0,0][1,0,0],兩者線性無關但不正交。

  譜定理使用時,要像4.2.的證明那樣求解。

4.5. Jordan標準型-最一般形式的最簡型

  Jordan標準型曾被認爲是線性代數的巔峯,但由於其在實際應用中不宜使用,且隨後發明了強大的SVD分解,Jordan標準型逐漸的被邊緣化,SVD成爲線性代數的巔峯。

  在矩陣特徵值分解中,我們要求待分解矩陣An×nA_{n\times n}至少有n個線性無關的特徵向量,如果A至多有s個線性無關特徵向量,s<ns < n,這樣的矩陣稱爲有缺陷的矩陣(defective matrices),但是這樣的矩陣也可以用類似特徵分解的方法分解到一個最簡單形式,這個最簡形式就是Jordan標準型。J=M1AM=[J1Js]J=M^{-1}AM=\left [ \begin{matrix} J_{1} & & & \\ & \dots & & \\ & & & J_{s}\end{matrix} \right ]

其中,Ji,i=1sJ_{i},i=1\dots s稱爲Jordan塊Ji=[λi1λi1λi1λi1λi]J_{i} = \left [ \begin{matrix} \lambda_{i} & 1 & & & & \\ & \lambda_{i} & 1 & & & \\ & & \lambda_{i} & & & \\ & & & \dots &1 & \\ & & & & \lambda_{i} & 1\\ & & & & & \lambda_{i}\\ \end{matrix} \right ]

在一個Jordan塊中,有同樣的特徵值,對應同一個特徵向量,不同的Jordan塊對應不同的特徵向量,但是不同的Jordan塊可以有相同的特徵值。可見對於一個有缺失的矩陣,其Jordan型會在每一個Jordan塊的次對角線上放1。

  有相同的特徵根的矩陣不一定相似,例如相似到下面的兩個Jordan標準型的矩陣,特徵值都爲2。
[2121221212]\left [ \begin{matrix} 2 & 1 & & & & \\ & 2 & 1 & & & \\ & & 2 & & & \\ & & & 2 &1 & \\ & & & & 2& 1\\ & & & & & 2\\ \end{matrix} \right ][2122121212]\left [ \begin{matrix} 2 & 1 & & & & \\ & 2 & & & & \\ & & 2 & 1 & & \\ & & & 2 &1 & \\ & & & & 2 & 1\\ & & & & & 2\\ \end{matrix} \right ]

所以,可以說相似的矩陣可以化簡到同一個Jordan標準型。

4.5.1. 應用

  和特徵值分解類似,Jordan標準型也可以用於求解微分方程和差分方程。

dudt=Auu(t)=eAtu(0)=MeJtM1u(0)\frac{du}{dt}=Au \Longrightarrow u(t)=e^{At}u(0)=Me^{Jt}M^{-1}u(0)

uk+1=Aukuk=Akuo=MJkM1u0u_{k+1}=Au_{k} \Longrightarrow u_{k}=A^{k}u_{o}=MJ^{k}M^{-1}u_{0}

這裏需要計算JJ中Jordan塊JikJ_{i}^{k},計算方法如下Ji=λiI+N=λi[111]+[010101]J_{i}=\lambda_{i}I+N=\lambda_{i}\left [ \begin{matrix} 1 & & &\\ & 1 & & \\ & & 1 & \\ & & & \dots \end{matrix} \right ]+\left [ \begin{matrix} 0& 1 & &\\ & 0 & 1 & \\ & & 0 & 1 \\ & & & \dots \end{matrix} \right ]

利用二項式定理展開Jik=λikI+Ck1λik1N+Ck2λik2N2J_{i}^{k}=\lambda_{i}^{k}I+C_{k}^{1}\lambda_{i}^{k-1}N+C_{k}^{2}\lambda_{i}^{k-2}N^{2}

其中N以N6×6N_{6\times 6}爲例,N6×6=[01010101010]N_{6\times 6}=\left [ \begin{matrix} 0 & 1 & & & & \\ & 0 & 1 & & & \\ & & 0 & 1& & \\ & & & 0 &1 & \\ & & & & 0 & 1\\ & & & & &0\\ \end{matrix} \right ]

N2N^{2}等於次對角線移動到第三對角線
N6×62=[001001001001000]N^{2}_{6\times 6}=\left [ \begin{matrix} 0 & 0 & 1& & & \\ & 0 & 0 &1 & & \\ & & 0 & 0& 1& \\ & & & 0 &0& 1\\ & & & & 0 & 0\\ & & & & &0\\ \end{matrix} \right ]

N3N^{3}等於次對角線移動到第四對角線
N6×63=[000100010001000000]N^{3}_{6\times 6}=\left [ \begin{matrix} 0 & 0 & 0& 1& & \\ & 0 & 0 &0 & 1& \\ & & 0 & 0& 0&1 \\ & & & 0&0& 0\\ & & & & 0 & 0\\ & & & & &0\\ \end{matrix} \right ]

依次向上移動即可

  計算eJite^{J_{i}t}類似,利用泰勒展開eJit=e(λiI+N)t=eλiIteNt=eλiIt[I+tN+(tN)22!+ ]e^{J_{i}t}=e^{(\lambda_{i} I +N)t}=e^{\lambda_{i} It}e^{ Nt}=e^{\lambda_{i} It}[I+tN+\frac{(tN)^{2}}{2!}+\dots]

4.6. 涉及相似的矩陣分解

  1. 矩陣AA可對角化,且有n個獨立的特徵向量,則S1AS=ΛS^{-1}AS=\Lambda(特徵值分解);
  2. AA是隨意方陣,存在酉矩陣UU,使得U1AU=TU^{-1}AU=T(相似分解的最一般形式);
  3. AA是normal矩陣,存在酉矩陣UU,使得U1AU=ΛU^{-1}AU=\Lambda;
  4. AA是隨意方陣,進行Jordan塊對角化,M1AM=JM^{-1}AM=J(特徵值分解的最一般性);
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章