矩陣論(零):線性代數基礎知識整理(1)——逆矩陣、(廣義)初等變換、滿秩分解

矩陣論專欄:專欄(文章按照順序排序)

線性代數是矩陣論的先修課程,本篇博客整理線性代數的基礎理論知識,爲矩陣論的學習做準備。限於篇幅,梳理的重點將在定理和結論上(只給出部分必要的定義),對最基礎的概念(如矩陣及其基本運算等等)不清楚的童鞋可以參考矩陣的基本運算
本文的討論在一般的數域FF中進行,FF可以是有理數域、實數域、複數域等。這裏不給出數域的嚴格定義,只要知道數域是複數域的一個對加減乘除運算封閉的子集,且有理數域是最小的數域即可。需要特別指出的是,我們所關心的數域都是複數域的子集,並不是什麼抽象的代數數域。由於數域都是複數域的子集,在複數中定義的基本運算以及相應的運算律往往也適用於實數、有理數,例如取共軛,實數和有理數的共軛是其自身。數域的相關理論可參考數域維基


本篇博客先介紹線性代數中一些基本的概念,然後重點圍繞“秩”這一重要概念整理相關結論:


複數的運算法則、復矩陣的共軛與共軛轉置

  • 複數的基本運算法則
    複數的基本運算法則與實數的完全一致,且根據複數的定義z=a+biz=a+bi容易驗證,現列舉如下:(設a,b,cCa, b, c\in C
    • 加法交換律:a+b=b+aa+b=b+a
    • 加法結合律:a+(b+c)=(a+b)+ca+(b+c)=(a+b)+c
    • 乘法交換律:a×b=b×aa\times b=b\times a
    • 乘法結合律:a×(b×c)=(a×b)×ca\times (b\times c)=(a\times b)\times c
    • 乘法對加法的左分配律:(a+b)×c=a×c+b×c(a+b)\times c=a\times c+b\times c
    • 乘法對加法的右分配律:a×(b+c)=a×b+a×ca\times (b+c)=a\times b+a\times c
  • 複數的共軛、複數的模的運算律(設x,yCx,y\in C
    • x±y=x±y\overline{x\pm{}y}=\overline{x}\pm{}\overline{y}
    • xy=xˉyˉ\overline{xy}=\bar{x}\bar{y}
    • (xy)=xy\overline{(\frac{x}{y})}=\frac{\overline{x}}{\overline{y}}
    • xx=xx=x2x\overline{x}=\overline{x}x=|x|^2
    • xy=xy|xy|=|x||y|
  • 矩陣的共軛
    矩陣的共軛就是將原矩陣的每個元素取共軛,即若A=(aij)m×nA=(a_{ij})_{m\times{n}},則A=(aij)m×n\overline{A}=(\overline{a_{ij}})_{m\times{n}}。實矩陣的共軛是其本身。根據複數共軛的運算率,可得矩陣的共軛具有如下性質:
    • A=A\overline{\overline{A}}=A
    • A+B=A+B\overline{A+B}=\overline{A}+\overline{B}
    • kA=kˉA,kC\overline{kA}=\bar{k}\overline{A},k\in{C}
    • AB=AˉBˉ\overline{AB}=\bar{A}\bar{B}
  • 矩陣的共軛轉置
    矩陣的共軛轉置即先取共軛再轉置或先轉置再取共軛,即AH=(AT)=(A)TA^H=\overline{(A^T)}=\Bigl(\overline{A}\Bigr)^T。實矩陣的轉置是復矩陣的共軛轉置的特例。矩陣的共軛轉置具有如下性質:
    • (AH)H=A(A^{H})^H=A
    • (AH)T=(AT)H(A^H)^T=(A^T)^H
    • AH=(A)H\overline{A^H}=(\overline A)^H
    • (A+B)H=AH+BH(A+B)^H=A^H+B^H
    • (kA)H=kAH,kC(kA)^H=\overline{k}A^H,k\in{C}
    • (AB)H=BHAH(AB)^H=B^HA^H
  • Hermite矩陣(共軛對稱矩陣)
    若方陣A滿足AH=AA^H=A,則稱A是Hermite矩陣。實對稱矩陣是一種Hermite矩陣。

行列式的性質

設F爲一數域,給定正整數nn,在FF上可以構造出唯一的映射Fn×nFF^{n\times n}\rightarrow F滿足行列式第一公理和行列式第二公理。行列式的具體表達式可以使用置換或逆序數寫出,本文略去,具體可參考博客以及知乎
A,BFn×nA,B\in F^{n\times n}kFk\in F爲常數,根據置換或逆序數的性質可得行列式的如下性質:

  • det(AT)=det(A)det(A^T)=det(A)
  • det(AH)=det(A)det(A^H)=\overline{det(A)}
  • det(kA)=kndet(A)det(kA)=k^ndet(A)
  • 行列式的某一行(列)乘非零常數kFk\in F,則行列式的值變爲原來的kk
  • 互換行列式的兩行(或兩列),則行列式的值取負
  • 行列式的某一行(列)加上另一行(列)的常數倍,行列式的值不變
  • det(AB)=det(A)det(B)det(AB)=det(A)det(B)
    證:見分塊矩陣的初等變換。
  • 若A是共軛對稱矩陣,則det(A)Rdet(A)\in R
    證:因爲det(A)=det(AH)=det(A)det(A)=det(A^H)=\overline{det(A)},所以det(A)det(A)的虛部爲零,det(A)Rdet(A)\in R

AFm×m,BFn×nA\in F^{m\times m},B\in F^{n\times n},則:

  • 若A是對角矩陣或上(下)三角矩陣,則A的行列式是A的主對角元之積
  • 拉普拉斯展開式一:AOB=AOB=AB\begin{vmatrix} A&*\\O&B\end{vmatrix}=\begin{vmatrix}A&O\\*&B\end{vmatrix}=|A||B|
  • 拉普拉斯展開式二:OAB=ABO=(1)mnAB\begin{vmatrix}O&A\\B&*\end{vmatrix}=\begin{vmatrix}*&A\\B&O\end{vmatrix}=(-1)^{mn}|A||B|

方陣的跡及其性質

  • 定義
    方陣A的跡tr(A)tr(A)定義爲A=(aij)n×nA=(a_{ij})_{n\times n}的主對角元之和,即tr(A)=i=1naiitr(A)=\sum_{i=1}^n a_{ii}
  • 性質
    • 設A、B均爲n階方陣,則tr(A±B)=tr(A)±tr(B)tr(A\pm{B)}=tr(A)\pm{}tr(B)
    • tr(cA)=ctr(A),cFtr(cA)=ctr(A),c\in{F}
    • tr(AT)=tr(A),tr(Aˉ)=tr(AH)=tr(A)tr(A^T)=tr(A),tr(\bar{A})=tr(A^H)=\overline{tr(A)}
      推論:tr(ATB)=tr(BTA)=i,jAijBijtr(A^TB)=tr(B^TA)=\sum_{i,j}A_{ij}B_{ij},其中A、B均爲m×nm\times{n}矩陣
    • 設A爲m×nm\times{n}矩陣,B爲n×mn\times{m}矩陣,則tr(AB)=tr(BA)=i,jAijBjitr(AB)=tr(BA)=\sum_{i,j}A_{ij}B_{ji}
    • 設A、B、C均爲m×nm\times{n}矩陣,則tr((AB)TC)=tr(AT(BC))=i,jAijBijCijtr((A\odot{B})^TC)=tr(A^T(B\odot{C}))=\sum_{i,j}A_{ij}B_{ij}C_{ij}式中\odot{}是逐元素乘法(Hadarmard積)
    • 設A、B、C均爲m×nm\times{n}矩陣,BB的所有元素均非零,則tr((AB)TC)=tr(AT(CB))=ijAijCijBijtr((A\oslash B)^TC)=tr(A^T(C\oslash B))=\sum_{ij}\frac{A_{ij}C_{ij}}{B_{ij}}式中\oslash是逐元素除法

逆矩陣

  • 定義
    AFn×nA\in F^{n\times n},若存在BFn×nB\in F^{n\times n}使得AB=BA=IAB=BA=I其中II是單位矩陣,則稱A是可逆的,B是A的逆矩陣,記爲B=A1B=A^{-1}
  • 定理:任意方陣的逆矩陣若存在則唯一
  • 伴隨矩陣
    • n階(n2)(n\geqslant{2})方陣A的伴隨矩陣AA^*定義爲:以AjiA_{ji}爲(i,j)元素的n階方陣,其中AijA_{ij}AA的(i,j)元素aija_{ij}的代數餘子式
    • 對任意n階(n2)(n\geqslant{2})方陣A,根據拉普拉斯展開式,有AA=AA=det(A)IAA^*=A^*A=det(A)I成立
  • 伴隨矩陣的性質(設A,BFn×n,n2A,B\in F^{n\times n},n\geqslant 2
    • (kA)=kn1A,kF(kA)^*=k^{n-1}A^*,k\in{F}
    • A=An1|A^*|=|A|^{n-1}
    • (A)=An2A(A^*)^*=|A|^{n-2}A
    • (A)T=(AT)(A^*)^T=(A^T)^*
    • (A)H=(AH)(A^*)^H=(A^H)^*
    • (AB)=BA(AB)^*=B^*A^*
  • 方陣可逆的充要條件
    • (行列式判定)n階方陣A=(aij)n×nA=(a_{ij})_{n\times{n}}可逆的充要條件是det(A)0det(A)\neq0,A的逆矩陣爲A1={Adet(A)n2(a111)1×1n=1A^{-1}=\begin{cases}\frac{A^*}{det(A)}&n\geqslant{2}\\(a_{11}^{-1})_{1\times{1}}&n=1\end{cases}
    • n階方陣A=(aij)n×nA=(a_{ij})_{n\times{n}}可逆的充要條件是存在BB使得AB=IAB=I
      證:
      必要性:若AA可逆,顯然取B=A1B=A^{-1}就有AB=IAB=I
      充分性:若存在BB使得AB=IAB=I,則由det(AB)=det(A)det(B)=det(I)=1det(AB)=det(A)det(B)=det(I)=1det(A)0det(A)\neq 0(否則的話就有det(AB)=0det(AB)=0det(AB)=1det(AB)=1矛盾),故由行列式判定知AA可逆。(此時若用A1A^{-1}左乘AB=IAB=I,就得到B=A1B=A^{-1},即這裏的BB只能是A1A^{-1}
      【注1】該結論可以看做是逆矩陣的定義的弱化。本來逆矩陣要求AB=IAB=IBA=IBA=I,但該結論說明只要AB=IAB=I就夠了(同理可知如果滿足BA=IBA=I也可推出AA可逆且B=A1B=A^{-1})。
      【注2】該結論的一個等價結論是“已知同階方陣A,BA,B,若AB=IAB=I,則BA=IBA=I”。
  • 逆矩陣的性質
    A,BFn×nA,B\in F^{n\times n}
    • (A1)1=A(A^{-1})^{-1}=A
    • (AT)1=(A1)T(A^T)^{-1}=(A^{-1})^T
    • (AH)1=(A1)H(A^H)^{-1}=(A^{-1})^H
    • (kA)1=1kA1,0kF(kA)^{-1}=\frac{1}{k}A^{-1},0\neq k\in F
    • (An)1=(A1)n(A^n)^{-1}=(A^{-1})^n
    • (A)1=(A1)=AA(A^*)^{-1}=(A^{-1})^*=\frac{A}{|A|}n2n\geqslant 2
    • (AB)1=B1A1(AB)^{-1}=B^{-1}A^{-1}
  • 特殊矩陣的逆矩陣
    • 若對角矩陣Σ=[λ1λn]\Sigma=\begin{bmatrix}\lambda_1&\quad\\\quad&\ddots&\quad\\\quad&\quad&\lambda_n\end{bmatrix}可逆,則其逆矩陣爲Σ1=[λ11λn1]\Sigma^{-1}=\begin{bmatrix}\lambda_1^{-1}&\quad\\\quad&\ddots&\quad\\\quad&\quad&\lambda_n^{-1}\end{bmatrix}
    • 若上三角方陣可逆,則其逆矩陣爲上三角方陣
    • 若下三角方陣可逆,則其逆矩陣爲下三角方陣

關於逆矩陣的一個常用公式

  • 定理:設ACm×m,UCm×p,BCp×q,VCq×mA\in C^{m\times m},U\in C^{m\times p},B\in C^{p\times q},V\in C^{q\times m}。若AA可逆,則A+UBVA+UBV可逆的充要條件爲Ip+BVA1UI_p+BVA^{-1}U可逆,且(A+UBV)1=A1A1U(Ip+BVA1U)1BVA1(A+UBV)^{-1}=A^{-1}-A^{-1}U(I_p+BVA^{-1}U)^{-1}BVA^{-1}
    證明:(該定理的證明需要用到特徵值的相關結論,若這塊不熟悉可先跳過,特徵值相關可參考矩陣論(零):線性代數基礎知識整理(5)——特徵值與相似
    AA可逆以及A+UBV=A(Im+A1UBV)A+UBV=A(I_m+A^{-1}UBV)知,A+UBVA+UBV可逆的充要條件爲Im+A1UBVI_m+A^{-1}UBV可逆。令M=A1U,N=BVM=A^{-1}U,N=BV,由MNMNNMNM有相同的非零特徵值可知,Im+MNI_m+MN可逆    \iff1-1不是MNMN的特徵值    \iff1-1不是NMNM的特徵值    \iffIp+NMI_p+NM可逆。這就證明了A+UBVA+UBV可逆的充要條件爲Ip+BVA1UI_p+BVA^{-1}U可逆。利用逆矩陣的定義容易驗證公式(A+UBV)1=A1A1U(I+BVA1U)1BVA1(A+UBV)^{-1}=A^{-1}-A^{-1}U(I+BVA^{-1}U)^{-1}BVA^{-1}的正確性。證畢。

該定理的如下推論較常見:

  • 推論1(Woodbury恆等式):設ACm×m,UCm×n,BCn×n,VCn×mA\in C^{m\times m},U\in C^{m\times n},B\in C^{n\times n},V\in C^{n\times m}。若A,BA,B可逆,則A+UBVA+UBV可逆的充要條件爲B1+VA1UB^{-1}+VA^{-1}U可逆,且(A+UBV)1=A1A1U(B1+VA1U)1VA1(A+UBV)^{-1}=A^{-1}-A^{-1}U(B^{-1}+VA^{-1}U)^{-1}VA^{-1}
    證:顯然該定理是上面的定理當BB取可逆方陣時的特殊情形。由於BB可逆且In+BVA1U=B(B1+VA1U)I_n+BVA^{-1}U=B(B^{-1}+VA^{-1}U),故A+UBVA+UBV可逆的充要條件爲B1+VA1UB^{-1}+VA^{-1}U可逆。(A+UBV)1=A1A1U(Ip+BVA1U)1(B1)1VA1=A1A1U(B1+VA1U)1VA1(A+UBV)^{-1}=A^{-1}-A^{-1}U(I_p+BVA^{-1}U)^{-1}(B^{-1})^{-1}VA^{-1}=A^{-1}-A^{-1}U(B^{-1}+VA^{-1}U)^{-1}VA^{-1}
  • 推論2(Sherman-Morrison定理):設ACn×nA\in C^{n\times n}可逆,u,vCn,bCu,v\in C^n,b\in C,則A+buvTA+buv^T可逆的充要條件爲1+bvTA1u01+bv^TA^{-1}u\neq 0,且(A+buvT)1=A1bA1uvTA11+bvTA1u(A+buv^T)^{-1}=A^{-1}-\frac{bA^{-1}uv^TA^{-1}}{1+bv^TA^{-1}u}
    證:顯然該定理是上面的定理當BB1×11\times 1矩陣(即標量)時的特殊情形。證明略。
  • 推論3:設ACn×nA\in C^{n\times n}可逆,u,vCnu,v\in C^n,則A+uvTA+uv^T可逆的充要條件爲1+vTA1u01+v^TA^{-1}u\neq 0,且(A+uvT)1=A1A1uvTA11+vTA1u(A+uv^T)^{-1}=A^{-1}-\frac{A^{-1}uv^TA^{-1}}{1+v^TA^{-1}u}
    證明:該定理是推論2當bb取1時的特殊情形。證明略。

【注】上述諸結論是在複數域下給出的,然而,可以看出既然在複數域下證明了這些結論,那麼其他數域下結論也成立。上述推論2和推論3由於結論更弱,有更簡便的證法,感興趣的讀者可自行研究。下面提供推論2的一個簡單證法作爲參考。

  • 推論2的簡單證法
    證:
    充分性:若1+bvTA1u01+bv^TA^{-1}u\neq 0,驗證(A+buvT)(A1bA1uvTA11+bvTA1u)=I(A+buv^T)(A^{-1}-\frac{bA^{-1}uv^TA^{-1}}{1+bv^TA^{-1}u})=I即可。
    必要性:注意由A+buvT=(I+buvTA1)AA+buv^T=(I+buv^TA^{-1})A可推出I+buvTA1I+buv^TA^{-1}可逆。假設1+bvTA1u=01+bv^TA^{-1}u=0,則(I+buvTA1)u=u+buvTA1u=uu=0(I+buv^TA^{-1})u=u+buv^TA^{-1}u=u-u=0。注意1+bvTA1u=01+bv^TA^{-1}u=0確保u0u\neq 0。這說明齊次線性方程組(I+buvTA1)x=0(I+buv^TA^{-1})x=0有非零解,這與I+buvTA1I+buv^TA^{-1}可逆是矛盾的。因此假設不成立,得證。

初等變換與矩陣的秩

行最簡形和列最簡形

  • 矩陣A稱爲行最簡形,若A的所有非零行都在零行的上面,A的每個非零行的首非零元是1,其列號隨行號嚴格單調遞增,且其所在列的其他元素均爲零。
  • 矩陣A稱爲列最簡形,若A的所有非零列都在零列的左面,A的每個非零列的首非零元是1,其行號隨列號嚴格單調遞增,且其所在行的其他元素均爲零。

初等變換

初等行(列)變換有三種:

  • 行(列)互換變換:互換矩陣的第i行(列)和第j行(列),iji\neq j
  • 行(列)倍乘變換:用非零常數kFk\in F乘矩陣的某一行(列)的每個元素
  • 行(列)倍加變換:將矩陣的第i行(列)的k倍(kF)(k\in{F})加到第j行(列),iji\neq j

初等行變換和初等列變換統稱爲初等變換。

初等矩陣

  • 定義:對單位矩陣只作1次初等行(列)變換得到的矩陣稱爲初等矩陣,初等矩陣也有三種,對應分別爲互換初等矩陣、倍乘初等矩陣、倍加初等矩陣
    【注】初等矩陣都是可逆的
  • 定理:設AFm×nA\in F^{m\times{n}},對A施行1次初等行變換,其結果等同於給A的左邊乘上一個相應的m階初等矩陣(對單位矩陣施行1次相同的初等行變換得到的矩陣);對A施行1次初等列變換,其結果等同於給A的右邊乘上一個相應的n階初等矩陣(對單位矩陣施行1次相同的初等列變換得到的矩陣)
  • 定理:(可逆矩陣與初等矩陣的關係)方陣A是可逆矩陣的充要條件是A可以寫成若干初等矩陣的積
  • 定理:任意矩陣A可通過有限次初等行變換化爲唯一的一個行最簡形,稱爲A的行最簡形;也可通過有限次初等列變換化爲唯一的一個列最簡形,稱爲A的列最簡形;即存在可逆矩陣P、Q使得PA是A的行最簡形,AQ是A的列最簡形

行等價與列等價

  • 定義:若矩陣A可經過若干次初等行(列)變換得到矩陣B,則稱A與B行(列)等價
  • 定義:若矩陣A可經過若干次初等變換得到矩陣B,則稱A與B等價
  • 定理:A與B行等價的充要條件爲存在可逆矩陣P使得PA=BPA=B;A與B列等價的充要條件爲存在可逆矩陣Q使得A=BQA=BQ;A與B等價的充要條件爲存在可逆矩陣P和Q使得PAQ=BPAQ=B
    證:由可逆矩陣的充要條件是其可被寫成若干初等矩陣的積即證。

矩陣的秩及其性質

  • 定義:矩陣A的最高階非零子式的階數稱爲A的秩,記爲r(A)或rank(A);當A沒有非零子式(即A=OA=O)時,定義r(A)=0r(A)=0
  • 定理:r(AH)=r(AT)=r(A)r(A^H)=r(A^T)=r(A)
  • 定義:設AFm×nA\in F^{m\times n},若r(A)=nr(A)=n,則稱A是列滿秩矩陣;若r(A)=mr(A)=m,則稱A是行滿秩矩陣;若r(A)=m=nr(A)=m=n,則稱A是滿秩方陣,顯然滿秩方陣就是可逆矩陣
  • 定理:初等行(列)變換不改變矩陣的秩
  • 定理:r(PA)=r(AQ)=r(A)r(PA)=r(AQ)=r(A),其中P、Q是可逆矩陣
    證:可逆矩陣可寫成若干初等矩陣的積,故PAPA相當於對AA做若干次初等行變換,AQAQ相當於對AA做若干次初等列變換,又因爲初等變換不改變矩陣的秩,故結論成立。
  • 定義:設AFm×n,r(A)=rA\in F^{m\times{n}},r(A)=r,A的秩標準形(又稱等價標準形、相抵標準形)定義爲[IrOOO]\begin{bmatrix}I_r&O\\O&O\end{bmatrix}
  • 定理:(等價標準形定理/相抵標準形定理/秩標準形定理)任意秩爲r的矩陣A可經有限次初等變換化爲A的秩標準形;即存在可逆矩陣P、Q使得PAQ=[IrOOO]PAQ=\begin{bmatrix}I_r&O\\O&O\end{bmatrix}
  • 定理:列滿秩矩陣可經有限次初等行變換化爲它的秩標準形,行滿秩矩陣可經有限次初等列變換化爲它的秩標準形
  • 定理:同型矩陣AABB等價的充要條件爲r(A)=r(B)=rr(A)=r(B)=r
    【注】所謂同型矩陣就是指兩個矩陣的大小(或規格)一樣,即若AAm×nm\times n的,則BB也是m×nm\times n的。
    證:
    充分性顯然。
    必要性:由秩標準形定理,存在可逆矩陣P1,Q1,P2,Q2P_1,Q_1,P_2,Q_2使得P1AQ1=P2BQ2=[IrOOO]P_1AQ_1=P_2BQ_2=\begin{bmatrix}I_r&O\\O&O\end{bmatrix},故(P21P1)A(Q1Q21)=B(P_2^{-1}P_1)A(Q_1Q_2^{-1})=B,即A與B等價。
  • 可逆方陣A求逆的方法:對[IA]\begin{bmatrix}I&A\end{bmatrix}進行初等行變換把A化成單位矩陣,則單位矩陣II就被自然地化成了A1A^{-1}
    分析:設[IA]\begin{bmatrix}I&A\end{bmatrix}經上述變換得到的結果爲[BI]\begin{bmatrix}B&I\end{bmatrix}。存在可逆矩陣P使得P[IA]=[BI]P\begin{bmatrix}I&A\end{bmatrix}=\begin{bmatrix}B&I\end{bmatrix},即P=BP=BPA=IPA=I,故B=P=A1B=P=A^{-1},即原本的單位矩陣II自然地化成了A1A^{-1}
  • 定理:r(BA)=r(AC)=r(A)r(BA)=r(AC)=r(A),其中B是列滿秩矩陣,C是行滿秩矩陣
    證:
    由B列滿秩,C行滿秩知,存在可逆矩陣P,Q使得PB=[IO],CQ=[IO]PB=\begin{bmatrix}I\\O\end{bmatrix},CQ=\begin{bmatrix}I&O\end{bmatrix},故r(BA)=r(P1[IO]A)=r([AO])=r(A)r(BA)=r(P^{-1}\begin{bmatrix}I\\O\end{bmatrix}A)=r(\begin{bmatrix}A\\O\end{bmatrix})=r(A)r(AC)=r(A[IO]Q1)=r([AO])=r(A)r(AC)=r(A\begin{bmatrix}I&O\end{bmatrix}Q^{-1})=r(\begin{bmatrix}A&O\end{bmatrix})=r(A)

分塊矩陣的初等變換

分塊矩陣是研究矩陣必不可少的工具,要想深入學習線性代數和矩陣論,一方面要學好線性空間與線性算子,另一方面要學好分塊矩陣。一些較爲深入的結論,有時從線性空間角度看更直觀,有時從分塊矩陣的角度看更直觀。分塊矩陣的基本運算請參考線性代數(四)-矩陣分塊法
分塊矩陣的初等變換,又稱廣義初等變換,可以用來解決一些較爲深入的秩的定理,還在相似、合同理論中有重要的應用。
所謂分塊矩陣的初等變換,實際上是對分塊矩陣進行多次初等變換,使結果整體上來看相當於變換的是矩陣的子塊。下面看一個例子:

  • 定理:設AFm×nA\in F^{m\times n}按行分塊爲A=[BC]A=\begin{bmatrix}B\\C\end{bmatrix},其中BFm1×n,CFm2×n,m1+m2=mB\in F^{m_1\times n},C\in F^{m_2\times n},m_1+m_2=m,矩陣DFm2×m1D\in F^{m_2\times m_1}。則可對AA進行若干次初等行變換(具體地,行倍加變換),使其變爲[BC+DB]\begin{bmatrix}B\\C+DB\end{bmatrix}
    證:
    注意到C+DBC+DB的第i行爲ci+diB=ci+j=1m1dijbjc_i+d_iB=c_i+\sum_{j=1}^{m_1}d_{ij}b_j,其中ci,dic_i,d_i分別是C,DC,D的第i行,bjb_jBB的第j行。於是只要依次將BB的第1行的di1d_{i1}倍、第2行的di2d_{i2}倍、……、第m1m_1行的dim1d_{im_1}倍加到CC的第i行,就將CC的第i行變成了C+DBC+DB的第i行。對i=1,2,...,m2i=1,2,...,m_2依次實施上述的一系列行倍加變換,就將AA變成了[BC+DB]\begin{bmatrix}B\\C+DB\end{bmatrix}

上面這個例子中,通過多次的初等行倍加變換,將AA的子塊CC變成了C+DBC+DB,即加上了AA的另一個子塊BBDD倍(注意DD是乘在左邊的),而這個“倍數”DD是沒有限制的,這個DD無論怎麼取,都能夠找到上述一系列初等行倍加變換以完成子塊CC的整體變換。這種“神奇”的技巧在理論分析時很有用,尤其是當你可以用這個技巧把矩陣的某個子塊變成零矩陣時,能大大降低計算的難度。通過初等變換把一個矩陣的某個子塊變成零矩陣的技術被稱作分塊消元法,俗稱矩陣打洞術。(聽說數學家華羅庚和他的學生就十分擅長這類技巧)

我們已經知道對矩陣實施一次初等行變換與在其左邊乘相應的初等矩陣的效果是等同的,如果進行一系列初等行變換,那麼就相當於在左邊乘一個可逆矩陣,那麼上述例子中對應的可逆矩陣是什麼呢?

實際上,設對某矩陣AA進行共kk次初等行變換,得到矩陣GG,變換對應的初等矩陣分別爲P1,P2,...,PkP_1,P_2,...,P_k,則PkPk1...P1A=GP_kP_{k-1}...P_1A=G,即對應在AA的左邊乘了個可逆矩陣P=PkPk1...P1P=P_kP_{k-1}...P_1。而PkPk1...P1=PkPk1...P1IP_kP_{k-1}...P_1=P_kP_{k-1}...P_1I,所以可逆矩陣PP實際上就是對單位矩陣也實施同樣的kk次初等行變換的結果。
據此,上述例子中對應的可逆矩陣就應是[Em1ODEm2]\begin{bmatrix}E_{m_1}&O\\D&E_{m_2}\end{bmatrix}(可以這樣想:對[BC]\begin{bmatrix}B\\C\end{bmatrix}實施一系列初等行變換後得到的是[BC+DB]\begin{bmatrix}B\\C+DB\end{bmatrix},效果就是給CC加上了BBDD倍,那麼對單位矩陣[Em1OOEm2]\begin{bmatrix}E_{m_1}&O\\O&E_{m_2}\end{bmatrix}實施相同的初等行變換後,效果應該是相同的,即給[OEm2]\begin{bmatrix}O&E_{m_2}\end{bmatrix}加上[Em1O]\begin{bmatrix}E_{m_1}&O\end{bmatrix}DD倍,於是得到[Em1ODEm2]\begin{bmatrix}E_{m_1}&O\\D&E_{m_2}\end{bmatrix})。驗證一下,根據行列式的拉普拉斯展開式,[Em1ODEm2]\begin{bmatrix}E_{m_1}&O\\D&E_{m_2}\end{bmatrix}確實是一個可逆矩陣,根據分塊矩陣乘法,[Em1ODEm2][BC]=[BC+DB]\begin{bmatrix}E_{m_1}&O\\D&E_{m_2}\end{bmatrix}\begin{bmatrix}B\\C\end{bmatrix}=\begin{bmatrix}B\\C+DB\end{bmatrix}確實成立。

前面說過三種初等行(列)變換對應三種初等矩陣,類比一下,對分塊矩陣實施三種分塊行初等變換就對應於在原矩陣的左邊乘三種分塊初等矩陣,類似地,對分塊矩陣實施三種分塊列初等變換就對應於在原矩陣的右邊乘三種分塊初等矩陣

三種分塊初等矩陣是指(爲簡單起見,以下只給出了四分塊的情形):
分塊倍加陣[Em1OCEm2]\begin{bmatrix}E_{m_1}&O\\C&E_{m_2}\end{bmatrix}[Em1COEm2]\begin{bmatrix}E_{m_1}&C\\O&E_{m_2}\end{bmatrix}
分塊倍乘陣[COOE]\begin{bmatrix}C&O\\O&E\end{bmatrix}[EOOC]\begin{bmatrix}E&O\\O&C\end{bmatrix},其中CC可逆;
分塊互換陣[OEm2Em1O]\begin{bmatrix}O&E_{m_2}&\\E_{m_1}&O\end{bmatrix}
【注】分塊初等矩陣並不是初等矩陣,初等矩陣是單位矩陣進行一次初等變換得到的,而分塊初等矩陣需要單位矩陣經過多次初等變換才能得到

分塊行初等變換:

  • 分塊行倍加變換:[Em1OCEm2][Am1×nBm2×n]=[AB+CA]\begin{bmatrix}E_{m_1}&O\\C&E_{m_2}\end{bmatrix}\begin{bmatrix}A_{m_1\times n}\\B_{m_2\times n}\end{bmatrix}=\begin{bmatrix}A\\B+CA\end{bmatrix}
    (相當於給BB加上了AACC倍,注意“倍數”CC乘在了AA的左邊)
  • 分塊行倍乘變換:[COOE][AB]=[CAB]\begin{bmatrix}C&O\\O&E\end{bmatrix}\begin{bmatrix}A\\B\end{bmatrix}=\begin{bmatrix}CA\\B\end{bmatrix},其中CC可逆的
    (相當於給AA乘上了CC倍,注意“倍數”CC乘在了AA的左邊)
  • 分塊行互換變換:[OEm2Em1O][Am1×nBm2×n]=[BA]\begin{bmatrix}O&E_{m_2}&\\E_{m_1}&O\end{bmatrix}\begin{bmatrix}A_{m_1\times n}\\B_{m_2\times n}\end{bmatrix}=\begin{bmatrix}B\\A\end{bmatrix}
    (相當於把子塊AABB交換了一下)

分塊列初等變換:

  • 分塊列倍加變換:[An×m1Bn×m2][Em1OCEm2]=[A+BCB]\begin{bmatrix}A_{n\times m_1}&B_{n\times m_2}\end{bmatrix}\begin{bmatrix}E_{m_1}&O\\C&E_{m_2}\end{bmatrix}=\begin{bmatrix}A+BC&B\end{bmatrix}
    (相當於給AA加上了BBCC倍,注意“倍數”CC乘在了BB的右邊)
  • 分塊列倍乘變換:[An×m1Bn×m2][COOEm2]=[ACB]\begin{bmatrix}A_{n\times m_1}&B_{n\times m_2}\end{bmatrix}\begin{bmatrix}C&O\\O&E_{m_2}\end{bmatrix}=\begin{bmatrix}AC&B\end{bmatrix},其中CC可逆的
    (相當於給AA乘上了CC倍,注意“倍數”CC乘在了AA的右邊)
  • 分塊列互換變換:[An×m1Bn×m2][OEm2Em1O]=[BA]\begin{bmatrix}A_{n\times m_1}&B_{n\times m_2}\end{bmatrix}\begin{bmatrix}O&E_{m_2}&\\E_{m_1}&O\end{bmatrix}=\begin{bmatrix}B&A\end{bmatrix}
    (相當於把子塊AABB交換了一下)

正如上面的定理指出的,一次分塊倍加變換可通過多次一般的倍加變換完成。一次分塊互換變換也可通過多次一般的互換變換完成。但是一次分塊倍乘變換不一定可由多次一般的倍乘變換完成,而是在同一個子塊內靈活地運用三種初等變換,關於這一點讀者可自行研究。因爲分塊初等變換實際上不過是執行了多次一般的初等變換而已,所以分塊初等變換均不改變矩陣的秩。此外,分塊倍加變換不改變矩陣的行列式的值。

矩陣打洞技巧

這裏列舉幾個常常碰到的矩陣打洞的情形,具體的用法請參考後文以及後面的博客。(以分塊行初等變換爲例)

  • [BAB]\begin{bmatrix}B\\AB\end{bmatrix}:給子塊ABAB加上子塊BBA-A倍,就能把ABAB消掉。[EOAE][BAB]=[BO]\begin{bmatrix}E&O\\-A&E\end{bmatrix}\begin{bmatrix}B\\AB\end{bmatrix}=\begin{bmatrix}B\\O\end{bmatrix}
  • [AB]\begin{bmatrix}A\\B\end{bmatrix}:如果AA可逆,則無論BB是什麼都能消掉BB[EOBA1E][AB]=[AO]\begin{bmatrix}E&O\\-BA^{-1}&E\end{bmatrix}\begin{bmatrix}A\\B\end{bmatrix}=\begin{bmatrix}A\\O\end{bmatrix}

暫時這兩個,想到不一樣的再補充~~

方陣乘積的行列式公式
  • 定理:設A,BFn×nA,B\in F^{n\times n},則det(AB)=det(A)det(B)det(AB)=det(A)det(B)
    證:
    對分塊矩陣做如下初等變換:[ABOOIn]行倍加[ABAOIn]列倍加[OABIn]\begin{bmatrix}AB&O\\O&I_n\end{bmatrix}\overset{\text{行倍加}}{\rightarrow}\begin{bmatrix}AB&A\\O&I_n\end{bmatrix}\overset{\text{列倍加}}{\rightarrow}\begin{bmatrix}O&A\\-B&I_n\end{bmatrix}因爲倍加變換不改變行列式的值,所以應用拉普拉斯公式就有det(AB)=det[ABOOIn]=det[OABIn]=(1)n2det(A)det(B)=det(A)det(B)det(AB)=det\begin{bmatrix}AB&O\\O&I_n\end{bmatrix}=det\begin{bmatrix}O&A\\-B&I_n\end{bmatrix}\\=(-1)^{n^2}det(A)det(-B)=det(A)det(B)
分塊矩陣的逆

分塊初等矩陣的逆:

  • [Em1OCEm2]1=[Em1OCEm2]\begin{bmatrix}E_{m_1}&O\\C&E_{m_2}\end{bmatrix}^{-1}=\begin{bmatrix}E_{m_1}&O\\-C&E_{m_2}\end{bmatrix}
  • [COOEm2]1=[C1OOEm2]\begin{bmatrix}C&O\\O&E_{m_2}\end{bmatrix}^{-1}=\begin{bmatrix}C^{-1}&O\\O&E_{m_2}\end{bmatrix},其中CC可逆
  • [OEm2Em1O]1=[OEm1Em2O]\begin{bmatrix}O&E_{m_2}&\\E_{m_1}&O\end{bmatrix}^{-1}=\begin{bmatrix}O&E_{m_1}&\\E_{m_2}&O\end{bmatrix}

分塊矩陣的逆的一般公式由以下結論導出:

  • 定理:設AFm×mA\in F^{m\times m}可逆,DFn×nD\in F^{n\times n},則[ABCD]\begin{bmatrix}A&B\\C&D\end{bmatrix}可逆的充要條件爲M=DCA1BM=D-CA^{-1}B可逆,且[ABCD]1=[A1+A1DM1CA1A1DM1M1CA1M1]\begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}=\begin{bmatrix}A^{-1}+A^{-1}DM^{-1}CA^{-1}&-A^{-1}DM^{-1}\\-M^{-1}CA^{-1}&M^{-1}\end{bmatrix}
    證:
    [ABCD]行倍加[ABODCA1B]列倍加[AOODCA1B]\begin{bmatrix}A&B\\C&D\end{bmatrix}\overset{\text{行倍加}}{\rightarrow}\begin{bmatrix}A&B\\O&D-CA^{-1}B\end{bmatrix}\overset{\text{列倍加}}{\rightarrow}\begin{bmatrix}A&O\\O&D-CA^{-1}B\end{bmatrix}由倍加變換不改變行列式的值,得det[ABCD]=det[AOODCA1B]=det(A)det(M)det\begin{bmatrix}A&B\\C&D\end{bmatrix}=det\begin{bmatrix}A&O\\O&D-CA^{-1}B\end{bmatrix}=det(A)det(M)det[ABCD]0det\begin{bmatrix}A&B\\C&D\end{bmatrix}\neq 0的充要條件爲det(M)0det(M)\neq 0,得證。
    將上述初等變換用分塊初等矩陣寫出就是[EmOCA1En][ABCD][EmA1BOEn]=[AOOM]\begin{bmatrix}E_{m}&O\\-CA^{-1}&E_{n}\end{bmatrix}\begin{bmatrix}A&B\\C&D\end{bmatrix}\begin{bmatrix}E_{m}&-A^{-1}B\\O&E_{n}\end{bmatrix}=\begin{bmatrix}A&O\\O&M\end{bmatrix}於是[ABCD]1=([EmOCA1En]1[AOOM][EmA1BOEn]1)1=[EmA1BOEn][A1OOM1][EmOCA1En]=[A1+A1BM1CA1A1BM1M1CA1M1]\begin{aligned}\begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}&=\left(\begin{bmatrix}E_{m}&O\\-CA^{-1}&E_{n}\end{bmatrix}^{-1}\begin{bmatrix}A&O\\O&M\end{bmatrix}\begin{bmatrix}E_{m}&-A^{-1}B\\O&E_{n}\end{bmatrix}^{-1}\right)^{-1}\\&=\begin{bmatrix}E_{m}&-A^{-1}B\\O&E_{n}\end{bmatrix}\begin{bmatrix}A^{-1}&O\\O&M^{-1}\end{bmatrix}\begin{bmatrix}E_{m}&O\\-CA^{-1}&E_{n}\end{bmatrix}\\&=\begin{bmatrix}A^{-1}+A^{-1}BM^{-1}CA^{-1}&-A^{-1}BM^{-1}\\-M^{-1}CA^{-1}&M^{-1}\end{bmatrix}\end{aligned}可以使用逆矩陣的定義驗證一下上式是否正確。

同理可得

  • 定理:設DFn×nD\in F^{n\times n}可逆,AFm×mA\in F^{m\times m},則[ABCD]\begin{bmatrix}A&B\\C&D\end{bmatrix}可逆的充要條件爲M=ABD1CM=A-BD^{-1}C可逆,且[ABCD]1=[M1M1BD1D1CM1D1+D1CM1BD1]\begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}=\begin{bmatrix}M^{-1}&-M^{-1}BD^{-1}\\-D^{-1}CM^{-1}&D^{-1}+D^{-1}CM^{-1}BD^{-1}\end{bmatrix}
  • 定理:設BFm×mB\in F^{m\times m}可逆,CFn×nC\in F^{n\times n},則[ABCD]\begin{bmatrix}A&B\\C&D\end{bmatrix}可逆的充要條件爲M=CDB1AM=C-DB^{-1}A可逆,且[ABCD]1=[M1DB1M1B1+B1AM1DB1B1AM1]\begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}=\begin{bmatrix}-M^{-1}DB^{-1}&M^{-1}\\B^{-1}+B^{-1}AM^{-1}DB^{-1}&-B^{-1}AM^{-1}\end{bmatrix}
  • 定理:設CFn×nC\in F^{n\times n}可逆,BFm×mB\in F^{m\times m},則[ABCD]\begin{bmatrix}A&B\\C&D\end{bmatrix}可逆的充要條件爲M=BAC1DM=B-AC^{-1}D可逆,且[ABCD]1=[C1DM1C1+C1DM1AC1M1M1AC1]\begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}=\begin{bmatrix}-C^{-1}DM^{-1}&C^{-1}+C^{-1}DM^{-1}AC^{-1}\\M^{-1}&-M^{-1}AC^{-1}\end{bmatrix}
分塊矩陣的秩

分塊矩陣是研究矩陣的秩的重要工具,從分塊矩陣的視角證明秩的結論往往非常簡便。這裏先給出一些基本結論:

  • 定理:r[AOOB]=r[OABO]=r(A)+r(B)r\begin{bmatrix}A&O\\O&B\end{bmatrix}=r\begin{bmatrix}O&A\\B&O\end{bmatrix}=r(A)+r(B),其中A,B是任意大小的矩陣
    證:(以r[AOOB]=r(A)+r(B)r\begin{bmatrix}A&O\\O&B\end{bmatrix}=r(A)+r(B)爲例)
    由矩陣的秩的定義,A,B中最高階非零子式的階數分別爲r(A),r(B)r(A),r(B),分別設這兩個子式爲A1,B1|A_1|,|B_1|,則A1OOB1\begin{vmatrix}A_1&O\\O&B_1\end{vmatrix}[AOOB]\begin{bmatrix}A&O\\O&B\end{bmatrix}的一個非零子式,故它的秩至少爲r(A)+r(B)。顯然任意階數大於r(A)+r(B)的子式也具有A2OOB2\begin{vmatrix}A_2&O\\O&B_2\end{vmatrix}的形式(其中A2A_2B2B_2的階數有可能爲零),且要麼A2A_2的階數大於r(A)r(A),要麼B2B_2的階數大於r(B)r(B),即det(A2)=0det(A_2)=0det(B2)=0det(B_2)=0,故由拉普拉斯展開式得A2OOB2=det(A2)det(B2)=0\begin{vmatrix}A_2&O\\O&B_2\end{vmatrix}=det(A_2)det(B_2)=0,這就證明了r[AOOB]=r(A)+r(B)r\begin{bmatrix}A&O\\O&B\end{bmatrix}=r(A)+r(B)
  • 定理:r[AOOB]r[AOB]r\begin{bmatrix}A&O\\O&B\end{bmatrix}\leqslant r\begin{bmatrix}A&O\\*&B\end{bmatrix}r[AOOB]r[AOB]r\begin{bmatrix}A&O\\O&B\end{bmatrix}\leqslant r\begin{bmatrix}A&*\\O&B\end{bmatrix}
    證:(以r[AOOB]r[AOB]r\begin{bmatrix}A&O\\O&B\end{bmatrix}\leqslant r\begin{bmatrix}A&O\\*&B\end{bmatrix}爲例)
    由拉普拉斯展開式知,[AOOB]\begin{bmatrix}A&O\\O&B\end{bmatrix}的一個最高階非零子式A1OOB1\begin{vmatrix}A_1&O\\O&B_1\end{vmatrix}對應於[AOB]\begin{bmatrix}A&O\\*&B\end{bmatrix}中的子式A1OB1\begin{vmatrix}A_1&O\\*&B_1\end{vmatrix}也非零,故結論成立。
  • 定理:r[OABO]r[OAB]r\begin{bmatrix}O&A\\B&O\end{bmatrix}\leqslant r\begin{bmatrix}O&A\\B&*\end{bmatrix}r[OABO]r[ABO]r\begin{bmatrix}O&A\\B&O\end{bmatrix}\leqslant r\begin{bmatrix}*&A\\B&O\end{bmatrix}
    證:與上同理。

滿秩分解

  • 定義:設矩陣AFrm×nA\in{F^{m\times{n}}_r}(即A是秩爲r的m×nm\times{n}矩陣),若存在列滿秩矩陣KFrm×rK\in{F^{m\times{r}}_r}和行滿秩矩陣LFrr×nL\in{F^{r\times{n}}_r}使得A=KLA=KL,則稱A=KLA=KL是A的一個滿秩分解
  • 定理:設矩陣AFrm×nA\in{F^{m\times{n}}_r},若r>0r\gt{0},則A的滿秩分解必存在
    證明:
    由相抵標準形定理,存在m階可逆矩陣P和n階可逆矩陣Q使得PAQ=[IrOOO]PAQ=\begin{bmatrix}I_r&O\\O&O\end{bmatrix},則A=P1[IrOOO]Q1=P1[IrO][IrO]Q1A=P^{-1}\begin{bmatrix}I_r&O\\O&O\end{bmatrix}Q^{-1}=P^{-1}\begin{bmatrix}I_r\\O\end{bmatrix}\begin{bmatrix}I_r&O\end{bmatrix}Q^{-1}。設K=P1[IrO]K=P^{-1}\begin{bmatrix}I_r\\O\end{bmatrix}L=[IrO]Q1L=\begin{bmatrix}I_r&O\end{bmatrix}Q^{-1},則K是列滿秩矩陣,L是行滿秩矩陣,且A=KLA=KL,故A=KLA=KL是A的一個滿秩分解。得證。
  • 滿秩分解的快速算法
    A=[a1a2an]Frm×n,r>0A=\begin{bmatrix}a_1&a_2&\cdots&a_n\end{bmatrix}\in{F^{m\times{n}}_r},r\gt{0}的行最簡形的前r行構成的矩陣爲L,L的第i行的首非零元在L的第jij_i列,設K=[aj1aj2ajr]K=\begin{bmatrix}a_{j_1}&&a_{j_2}&\cdots&a_{j_r}\end{bmatrix},則A=KLA=KL是A的一個滿秩分解。
    證明:
    存在可逆矩陣P、Q使得PAPA是A的行最簡形,且PAQ=[IrOOO]PAQ=\begin{bmatrix}I_r&O\\O&O\end{bmatrix}。由於PA=[IrOOO]Q1=[[IrO]Q1O]PA=\begin{bmatrix}I_r&O\\O&O\end{bmatrix}Q^{-1}=\begin{bmatrix}\begin{bmatrix}I_r&O\end{bmatrix}Q^{-1}\\O\end{bmatrix},所以L=[IrO]Q1L=\begin{bmatrix}I_r&O\end{bmatrix}Q^{-1},顯然L是行滿秩的。設e1,e2,...,enFne_1,e_2,...,e_n\in F^n,其中eie_i是第i個標準向量,eie_i的第ii個元素爲1,其他元素爲零。設Z=[ej1ej2ejr]Z=\begin{bmatrix}e_{j_1}&e_{j_2}\cdots&e_{j_r}\end{bmatrix},由行最簡形的定義易知PAZ=[IrO]PAZ=\begin{bmatrix}I_r\\O\end{bmatrix},故AZ=P1[IrO]AZ=P^{-1}\begin{bmatrix}I_r\\O\end{bmatrix}。由矩陣K的定義知K=AZK=AZ,故實際上K=P1[IrO]K=P^{-1}\begin{bmatrix}I_r\\O\end{bmatrix},且K是列滿秩的。因爲KL=P1[IrO][IrO]Q1=P1[IrOOO]Q1=AKL=P^{-1}\begin{bmatrix}I_r\\O\end{bmatrix}\begin{bmatrix}I_r&O\end{bmatrix}Q^{-1}=P^{-1}\begin{bmatrix}I_r&O\\O&O\end{bmatrix}Q^{-1}=A,故A=KLA=KL是A的一個滿秩分解。
    【注】上述定理說明,滿秩分解無需求出可逆矩陣P和Q,只需對A進行初等行變換化爲行最簡形,利用A的行最簡形和A本身就能得出結果。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章