矩陣論(零):線性代數基礎知識整理(3)——矩陣的秩與向量組的秩

矩陣論專欄:專欄(文章按照順序排序)

本篇博客接着上篇博客矩陣論(零):線性代數基礎知識整理(2)——矩陣的秩與向量組的秩的內容,主要整理秩相關的結論。

  • 線性方程組的解與向量組的秩
    • 線性方程組的解
    • 向量組的秩
  • 零矩陣的判定定理
  • 關於秩的重要結論(結合向量組的秩、分塊矩陣的秩的方法進行總結)
    • 矩陣的秩與向量組的秩的關係
    • 常用矩陣秩相關的等式和不等式
      • 公式1:r(A)r(B)r(A±B)r(A)+r(B)|r(A)-r(B)|\leqslant r(A\pm B)\leqslant{}r(A)+r(B)以及取等號的條件
      • 公式2:r(AB)min{r(A),r(B)}r(AB)\leqslant{}min\{r(A),r(B)\}
      • 公式3(Sylvester不等式):r(A)+r(B)nr(AB)r(A)+r(B)-n\leqslant{}r(AB)以及取等號的條件
      • 公式4(Frobenius不等式)r(ABC)r(AB)+r(BC)r(B)r(ABC)\geqslant r(AB)+r(BC)-r(B)以及取等號的條件
      • 公式5r(IAB)r(IA)+r(IB)r(I-AB)\leqslant r(I-A)+r(I-B)
      • 公式6:若AB=BAAB=BA,則r(A+B)r(A)+r(B)r(AB)r(A+B)\leqslant r(A)+r(B)-r(AB)
      • 公式7r(AHA)=r(AAH)=r(A)r(A^HA)=r(AA^H)=r(A)
      • 公式8:若W=YTAXW=Y^TAX非奇異,則r(AAXW1YTA)=r(A)r(AXW1YTA)r(A-AXW^{-1}Y^TA)=r(A)-r(AXW^{-1}Y^TA)
        • 推論:Wedderburn秩1化簡公式
      • 公式9:設AAnn階方陣,則r(An)=r(An+1)=r(An+2)=...r(A^n)=r(A^{n+1})=r(A^{n+2})=...
    • 常見相關推論

由於篇幅太長,加上公式太多打開網頁渲染慢的原因,目錄中的內容分兩篇博客來寫,上篇是矩陣論(零):線性代數基礎知識整理(2)——矩陣的秩與向量組的秩。上篇博客包含:目錄中公式3及其之前的所有內容,包括定理1~20和所有提到的定義。


常用秩的等式和不等式

  • 引理:r[AOCB]=r[AOOB]r\begin{bmatrix}A&O\\C&B\end{bmatrix}=r\begin{bmatrix}A&O\\O&B\end{bmatrix}的充要條件爲存在矩陣X,YX,Y使得C=XA+BYC=XA+BY
    證:
    充分性:r[AOCB]=r[AOXA+BYB]=行變換r[AOBYB]=列變換r[AOOB]\begin{aligned}r\begin{bmatrix}A&O\\C&B\end{bmatrix}&=r\begin{bmatrix}A&O\\XA+BY&B\end{bmatrix}\\&\overset{\text{行變換}}{=}r\begin{bmatrix}A&O\\BY&B\end{bmatrix}\\&\overset{\text{列變換}}{=}r\begin{bmatrix}A&O\\O&B\end{bmatrix}\end{aligned}
    必要性:由等價標準形定理,存在可逆矩陣P1,Q1,P2,Q2P_1,Q_1,P_2,Q_2使得P1AQ1=[ItOOO]P_1AQ_1=\begin{bmatrix}I_t&O\\O&O\end{bmatrix}P2BQ2=[IsOOO]P_2BQ_2=\begin{bmatrix}I_s&O\\O&O\end{bmatrix},其中t=r(A),s=r(B)t=r(A),s=r(B)。計算可得[P1OOP2][AOOB][Q1OOQ2]=[ItOIsO]\begin{bmatrix}P_1&O\\O&P_2\end{bmatrix}\begin{bmatrix}A&O\\O&B\end{bmatrix}\begin{bmatrix}Q_1&O\\O&Q_2\end{bmatrix}=\begin{bmatrix}I_t&&&\\&O&&\\&&I_s&\\&&&O\end{bmatrix}以及[P1OOP2][AOCB][Q1OOQ2]=[ItOD1D2IsD3D4O]\begin{bmatrix}P_1&O\\O&P_2\end{bmatrix}\begin{bmatrix}A&O\\C&B\end{bmatrix}\begin{bmatrix}Q_1&O\\O&Q_2\end{bmatrix}=\begin{bmatrix}I_t&&&\\&O&&\\D_1&D_2&I_s&\\D_3&D_4&&O\end{bmatrix}其中[D1D2D3D4]=P2CQ1\begin{bmatrix}D_1&D_2\\D_3&D_4\end{bmatrix}=P_2CQ_1。由於左乘/右乘可逆矩陣不改變矩陣的秩,上面兩個式子等號右端的分塊矩陣有相同的秩。第二式等號右端的矩陣可通過分塊行初等變換消去子塊D1,D3D_1,D_3,再通過分塊列初等變換消去子塊D2D_2,於是r[ItOIsO]=r[ItOD1D2IsD3D4O]=r[ItOIsD4O]r\begin{bmatrix}I_t&&&\\&O&&\\&&I_s&\\&&&O\end{bmatrix}=r\begin{bmatrix}I_t&&&\\&O&&\\D_1&D_2&I_s&\\D_3&D_4&&O\end{bmatrix}=r\begin{bmatrix}I_t&&&\\&O&&\\&&I_s&\\&D_4&&O\end{bmatrix}t+s=r[ItOIsO]=r[ItOIsD4O]=t+s+r(D4)t+s=r\begin{bmatrix}I_t&&&\\&O&&\\&&I_s&\\&&&O\end{bmatrix}=r\begin{bmatrix}I_t&&&\\&O&&\\&&I_s&\\&D_4&&O\end{bmatrix}=t+s+r(D_4)這就得到r(D4)=0r(D_4)=0D4=OD_4=OP2CQ1=[D1D2D3O]P_2CQ_1=\begin{bmatrix}D_1&D_2\\D_3&O\end{bmatrix}。令S=[D1OD3O]S=\begin{bmatrix}D_1&O\\D_3&O\end{bmatrix}T=[OD2OO]T=\begin{bmatrix}O&D_2\\O&O\end{bmatrix},則有SP1AQ1+P2BQ2T=S+T=P2CQ1SP_1AQ_1+P_2BQ_2T=S+T=P_2CQ_1。兩端左乘P21P_2^{-1},右乘Q11Q_1^{-1}P21SP1A+BQ2TQ11=CP_2^{-1}SP_1A+BQ_2TQ_1^{-1}=C,令X=P21SP1,Y=Q2TQ11X=P_2^{-1}SP_1,Y=Q_2TQ_1^{-1}就有XA+BY=CXA+BY=C
    【注】這個引理的證明可以說是充分利用了分塊矩陣的技巧。結論的意義不僅在於給出Frobenius不等式取等號的充要條件(如下),更重要的是這個引理給出了一類矩陣方程有解的充要條件,這類矩陣方程具有形式XA+BY=CXA+BY=C,稱爲Lyapunov方程,是一種雙邊多項式矩陣方程(bilateral polynominal matrix equation),其中X,YX,Y是未知量。這種方程經常在自動控制理論、線性系統理論中遇到。

  • 公式4(Frobenius不等式):設AFm×n,BFn×s,CFs×tA\in F^{m\times n},B\in F^{n\times s},C\in F^{s\times t},則r(ABC)r(AB)+r(BC)r(B)r(ABC)\geqslant r(AB)+r(BC)-r(B)。取等號的充要條件爲存在矩陣X,YX,Y使得B=XAB+BCYB=XAB+BCY
    證:先證明不等式,再考慮取等號的條件。
    法1:分塊矩陣初等變換
    r(AB)+r(BC)=r[ABOOBC]r[ABOBBC]=行變換r[OABCBBC]=列變換r[OABCBO]=r(B)+r(ABC)\begin{aligned}r(AB)+r(BC)=r\begin{bmatrix}AB&O\\O&BC\end{bmatrix}&\leqslant r\begin{bmatrix}AB&O\\B&BC\end{bmatrix}\\&\overset{\text{行變換}}{=}r\begin{bmatrix}O&-ABC\\B&BC\end{bmatrix}\\&\overset{\text{列變換}}{=}r\begin{bmatrix}O&-ABC\\B&O\end{bmatrix}\\&=r(B)+r(ABC)\end{aligned}或將上述初等變換過程用分塊初等矩陣寫出,即[ImAOIn][ABOBBC][IsCOIt]=[OABCBO]\begin{bmatrix}I_m&-A\\O&I_n\end{bmatrix}\begin{bmatrix}AB&O\\B&BC\end{bmatrix}\begin{bmatrix}I_s&-C\\O&I_t\end{bmatrix}=\begin{bmatrix}O&-ABC\\B&O\end{bmatrix}於是r(ABC)+r(B)=r[OABCBO]=r[ABOBBC]r(AB)+r(BC)r(ABC)+r(B)=r\begin{bmatrix}O&-ABC\\B&O\end{bmatrix}=r\begin{bmatrix}AB&O\\B&BC\end{bmatrix}\geqslant r(AB)+r(BC)
    【注】令B=IB=I,可見Sylvester不等式只是Frobenius不等式的一個特例,因此還可從推廣Sylvester不等式的角度出發證明Frobenius不等式:
    法2:利用Sylvester不等式
    r(B)=0r(B)=0,顯然結論成立;若r(B)0r(B)\neq 0,考慮BB的一個滿秩分解B=KLB=KL,其中K,LK,L分別爲列滿秩矩陣(有r(B)列)和行滿秩矩陣(有r(B)行),則r(ABC)=r(AKLC)r(AK)+r(LC)r(B)=r(AKL)+r(KLC)r(B)=r(AB)+r(BC)r(B)r(ABC)=r(AKLC)\geqslant r(AK)+r(LC)-r(B)=r(AKL)+r(KLC)-r(B)=r(AB)+r(BC)-r(B)
    .
    【取等號的充要條件】
    從法1的證明過程容易看出,取等號的充要條件爲r[ABOOBC]=r[ABOBBC]r\begin{bmatrix}AB&O\\O&BC\end{bmatrix}=r\begin{bmatrix}AB&O\\B&BC\end{bmatrix}於是由引理立即可得,取等號的充要條件爲存在X,YX,Y使得B=XAB+BCYB=XAB+BCY

  • 公式5r(IAB)r(IA)+r(IB)r(I-AB)\leqslant r(I-A)+r(I-B)
    證:利用公式1和2
    r(IAB)=r(IA+AAB)r(IA)+r(A(IB))r(IA)+r(IB)r(I-AB)=r(I-A+A-AB)\leqslant r(I-A)+r(A(I-B))\leqslant r(I-A)+r(I-B)
    【注】這個感覺更像是一個課後習題,不過這個公式從形式上來看挺有趣的~

  • 公式6:設AABB爲同階方陣,滿足AB=BAAB=BA,則r(A+B)r(A)+r(B)r(AB)r(A+B)\leqslant r(A)+r(B)-r(AB)
    證:分塊矩陣的初等變換+分塊矩陣恆等式的構造
    注意到下述分塊矩陣恆等式[(A+B)AOI][AAAA+B]=[BAOAA+B]\begin{bmatrix}-(A+B)&A\\O&I\end{bmatrix}\begin{bmatrix}A&A\\A&A+B\end{bmatrix}=\begin{bmatrix}-BA&O\\A&A+B\end{bmatrix}於是r(A)+r(B)=r[AOOB]=行變換r[AOAB]=列變換r[AAAA+B]r[BAOAA+B]2r[BAOOA+B]=r(BA)+r(A+B)=r(AB)+r(A+B)\begin{aligned}r(A)+r(B)=r\begin{bmatrix}A&O\\O&B\end{bmatrix}&\overset{\text{行變換}}{=}r\begin{bmatrix}A&O\\A&B\end{bmatrix}\\&\overset{\text{列變換}}{=}r\begin{bmatrix}A&A\\A&A+B\end{bmatrix}\\&\geqslant r\begin{bmatrix}-BA&O\\A&A+B\end{bmatrix}(公式2)\\&\geqslant r\begin{bmatrix}-BA&O\\O&A+B\end{bmatrix}\\&=r(BA)+r(A+B)\\&=r(AB)+r(A+B)\end{aligned}【注】這個公式可以看做是在AABB可交換(也就是AB=BAAB=BA)的條件下,公式1的一個加強版。與公式1相比,這個公式顯然更加緊湊。

  • 公式7r(AHA)=r(AAH)=r(A)r(A^HA)=r(AA^H)=r(A)
    證:只需證r(AHA)=r(A)r(A^HA)=r(A),因爲由r(AHA)=r(A)r(A^HA)=r(A)可推出r(AAH)=r(AH)=r(A)r(AA^H)=r(A^H)=r(A)
    法1:線性方程組
    考慮兩個齊次線性方程組AHAx=0A^HAx=0Ax=0Ax=0,顯然Ax=0AHAx=0Ax=0\Rightarrow A^HAx=0,現證明AHAx=0Ax=0A^HAx=0\Rightarrow Ax=0:用xHx^H左乘AHAx=0A^HAx=0的兩端得到xHAHAx=(Ax)H(Ax)=i(Ax)i2=0x^HA^HAx=(Ax)^H(Ax)=\sum_i|(Ax)_i|^2=0,其中(Ax)i(Ax)_iAxAx的第i個分量,故Ax=0Ax=0。這說明AHAx=0A^HAx=0Ax=0Ax=0是同解方程組,故它們的基礎解系所含解向量個數相等,即nr(AHA)=nr(A)n-r(A^HA)=n-r(A),故r(AHA)=r(A)r(A^HA)=r(A)
    【題外話】通過齊次線性方程組的基礎解系分析矩陣的秩在公式7的證明上不得不說是十分簡潔、巧妙的,網上大多都是這種解法。然而,這並不意味着公式7沒有其他證明思路,下面舉兩例。
    法2:向量組
    AA列向量組的一個極大無關組a1,a2,...,ara_1,a_2,...,a_r,其中r=r(A)r=r(A),並令K=[a1a2ar]K=\begin{bmatrix}a_1&a_2&\cdots&a_r\end{bmatrix},考察AHa1,,AHarA^Ha_1,\cdots,A^Ha_r是否是AHAA^HA列向量組的一個極大無關組即可。考慮齊次線性方程組KHKx=0K^HKx=0的解,兩端左乘xHx^H得到xHKHKx=Kx22=0x^HK^HKx=||Kx||^2_2=0,從而Kx=0Kx=0。根據KK的列向量組線性無關,得知x=0x=0,即只有零解。根據線性無關的定義知KHKK^HK的列向量組KHa1,KHa2,,KHarK^Ha_1,K^Ha_2,\cdots,K^Ha_r是線性無關的,從而延伸組AHa1,AHa2,,AHarA^Ha_1,A^Ha_2,\cdots,A^Ha_r也線性無關。假設AHAA^HA有多於rr個線性無關的列向量,可設爲AHai1,,AHais,s>rA^Ha_{i_1},\cdots,A^Ha_{i_s},s>r,並設ki1ai1++kisais=0k_{i_1}a_{i_1}+\cdots+k_{i_s}a_{i_s}=0,兩端左乘AHA^Hki1AHai1++kisAHais=0k_{i_1}A^Ha_{i_1}+\cdots+k_{i_s}A^Ha_{i_s}=0,從而ki1==kis=0k_{i_1}=\cdots=k_{i_s}=0,這說明ai1,,aisa_{i_1},\cdots,a_{i_s}是線性無關的,而這與r(A)=rr(A)=r矛盾,因此AHAA^HA至多有rr個線性無關的列向量。這就證明了AHa1,,AHarA^Ha_1,\cdots,A^Ha_rAHAA^HA列向量組的一個極大無關組,從而r(AHA)=r=r(A)r(A^HA)=r=r(A)
    法3:滿秩分解+特徵值
    先證明Am×nA_{m\times n}列滿秩的情形。由AA列滿秩,AA有一個n階非零子式,其對應的子矩陣是可逆的,不失一般性,設A=[BC]A=\begin{bmatrix}B\\C\end{bmatrix},其中BB是可逆子矩陣。則AHA=BHB+CHC=BH(I+(CB1)HCB1)BA^HA=B^HB+C^HC=B^H(I+(CB^{-1})^HCB^{-1})B,注意到(CB1)HCB1(CB^{-1})^HCB^{-1}的特徵值是非負的,從而I+(CB1)HCB1I+(CB^{-1})^HCB^{-1}的特徵值都不小於1,I+(CB1)HCB1I+(CB^{-1})^HCB^{-1}可逆,進而BH(I+(CB1)HCB1)BB^H(I+(CB^{-1})^HCB^{-1})BAHAA^HA也是可逆的,於是r(AHA)=r(A)r(A^HA)=r(A)
    接下來證明一般情形。若A=OA=O則結論顯然成立,否則可設A=KLA=KLAA的一個滿秩分解,則AHA=LH(KHK)LA^HA=L^H(K^HK)L,因爲LL行滿秩,LHL^H列滿秩,故r(AHA)=r((KHK)L)=r(KHK)r(A^HA)=r((K^HK)L)=r(K^HK)。由已證情形的結論知KHKK^HK是可逆的r(A)r(A)階方陣,因此r(AHA)=r(A)r(A^HA)=r(A)
    【注】證明中用到的特徵值相關結論見矩陣論(零):線性代數基礎知識整理(5)——特徵值與相似

  • 公式8:設AFm×nA\in F^{m\times n}XFn×kX\in F^{n\times k}YFm×kY\in F^{m\times k}。W=YTAXW=Y^TAX非奇異,則r(AAXW1YTA)=r(A)r(AXW1YTA)r(A-AXW^{-1}Y^TA)=r(A)-r(AXW^{-1}Y^TA)
    證:
    法1:注意到這個公式不過是公式1取等號情形的一個特殊情況,因此可以利用公式1取等號的充要條件。
    B=AXW1YTAB=AXW^{-1}Y^TA,原公式即r(AB)+r(B)=r(A)r(A-B)+r(B)=r(A)。只要證明存在矩陣CCDD使得C(AB)=ABC(A-B)=A-BCB=OCB=O(AB)D=O(A-B)D=OBD=BBD=B,結論便成立。取C=IAXW1YTC=I-AXW^{-1}Y^TD=XW1YTAD=XW^{-1}Y^TA,證畢。
    法2:使用分塊矩陣初等變換技術直接證明
    B=AXW1YTAB=AXW^{-1}Y^TA。實際上是要證r(AB)+r(B)=r(A)r(A-B)+r(B)=r(A),故考慮下述分塊初等變換過程:r(AB)+r(B)=r[ABOOB]=列變換r[ABOBB]=行變換r[ABBB]=列變換r[AOBB(IXW1YTA)]=行變換r[AOOB(IXW1YTA)]\begin{aligned}r(A-B)+r(B)&=r\begin{bmatrix}A-B&O\\O&B\end{bmatrix}\\&\overset{\text{列變換}}{=}r\begin{bmatrix}A-B&O\\B&B\end{bmatrix}\\&\overset{\text{行變換}}{=}r\begin{bmatrix}A&B\\B&B\end{bmatrix}\\&\overset{\text{列變換}}{=}r\begin{bmatrix}A&O\\B&B(I-XW^{-1}Y^TA)\end{bmatrix}\\&\overset{\text{行變換}}{=}r\begin{bmatrix}A&O\\O&B(I-XW^{-1}Y^TA)\end{bmatrix}\end{aligned}注意到右下角子塊B(IXW1YTA)=BAXW1(YTAX)W1YTA=BB=OB(I-XW^{-1}Y^TA)=B-AXW^{-1}(Y^TAX)W^{-1}Y^TA=B-B=O,故r(AB)+r(B)=r(A)r(A-B)+r(B)=r(A)。證畢。

  • 推論(Wedderburn秩1化簡公式,Wedderburn rank-one reduction formula):設AFm×nA\in F^{m\times n}xFnx\in F^nyFmy\in F^m。w=yTAx0w=y^TAx\neq 0,則r(Aw1AxyTA)=r(A)1r(A-w^{-1}Axy^TA)=r(A)-1
    證:
    由公式8可得r(Aw1AxyTA)=r(A)r(w1AxyTA)r(A-w^{-1}Axy^TA)=r(A)-r(w^{-1}Axy^TA),所以這裏的關鍵是證明r(w1AxyTA)=r(AxyTA)=1r(w^{-1}Axy^TA)=r(Axy^TA)=1。由公式2可得r(AxyTA)r(x)=1r(Axy^TA)\leqslant r(x)=1(注意r(x)0r(x)\neq 0,因爲如果這樣的話就有x=0x=0,則AxyTA=OAxy^TA=Or(AxyTA)=1r(Axy^TA)=1矛盾),故只需證明r(AxyTA)1r(Axy^TA)\geqslant 1。實際上,假設r(AxyTA)=0r(Axy^TA)=0,即AxyTA=OAxy^TA=O,則w=yT(w1AxyTA)x=0w=y^T(w^{-1}Axy^TA)x=0,與已知矛盾,故假設不成立。得證。
    【注】這個公式是說,給矩陣AA一個特定形式的秩1擾動,則AA的秩的改變量恰好也是1。而這對於一般的秩1擾動並不成立。

  • 公式9:設AAnn階方陣,則r(An)=r(An+1)=r(An+2)=...r(A^n)=r(A^{n+1})=r(A^{n+2})=...
    【不算是題外話】根據公式2,我們知道任意k=1,2,...k=1,2,...都有r(Ak+1)r(Ak)r(A^{k+1})\leqslant r(A^k),也就是說,AA的冪的秩隨着冪指數增加是單調減的。如果我們把r(Ak+1)<r(Ak)r(A^{k+1})<r(A^k)(也就是當冪指數增加1,AA的冪的秩減少了)稱作是一次“衰減”,那麼這種“衰減”最多可以發生n次(n=A的階數),否則AA的冪的秩就會變成負的。那麼問題來了,既然衰減是有限次的,什麼時候衰減會結束?也就是說,當冪指數增加到多大以後,就再也不會發生衰減?公式9將告訴我們,衰減全部在指數達到n之前發生,指數達到n以後不可能再發生衰減
    證:
    法1:線性方程組
    考慮齊次線性方程組Anx=0A^nx=0An+1x=0A^{n+1}x=0,顯然前者的解都是後者的解,現在證明後者的解也都是前者的解。假設An+1x=0A^{n+1}x=0有一解x0x_0不是Anx=0A^nx=0的解,即Anx00A^nx_0\neq 0,那麼向量組An1x0,An2x0,...,Ax0,x0A^{n-1}x_0,A^{n-2}x_0,...,Ax_0,x_0中每個向量一定都非零(否則就可推出Anx0=0A^nx_0=0,矛盾)。設k0x0+k1Ax0+...+knAnx0=0k_0x_0+k_1Ax_0+...+k_nA^nx_0=0,其中k0,k1,...,knk_0,k_1,...,k_n爲常數。該式兩端左乘AnA^n,可得k0Anx0=0k_0A^nx_0=0,根據Anx00A^nx_0\neq 0k0=0k_0=0,等式變爲k1Ax0+k2A2x0+...+knAnx0=0k_1Ax_0+k_2A^2x_0+...+k_nA^nx_0=0。同理,該式兩端左乘An1A^{n-1},可推出k1=0k_1=0。採用類似的做法,最終可得到k0=k1=...=kn=0k_0=k_1=...=k_n=0,這就證明了Anx0,An2x0,...,Ax0,x0A^{n}x_0,A^{n-2}x_0,...,Ax_0,x_0是線性無關的。一個包含n+1n+1個向量的nn維向量組是線性無關的,這是矛盾的,因此假設不成立,An+1x=0A^{n+1}x=0的解一定都是Anx=0A^nx=0的解。兩方程組同解,則它們的基礎解系所含解向量個數相等,即nr(An+1)=nr(An)n-r(A^{n+1})=n-r(A^n),故r(An)=r(An+1)r(A^n)=r(A^{n+1})。同理可證任意m>nm>nr(Am)=r(Am+1)r(A^m)=r(A^{m+1}),因此結論成立。證畢。
    法2:分塊矩陣初等變換
    如果r(An)=0r(A^n)=0或者r(A)=nr(A)=n,則結論顯然成立。現考慮r(An)>0r(A^n)>0r(A)<nr(A)<n的情形。考慮不等式鏈r(An)r(An1)...r(A)<nr(A^n)\leqslant r(A^{n-1})\leqslant...\leqslant r(A)<n,式中的\leqslant不可能全部取<<,否則將有r(An)0r(A^n)\leqslant 0r(An)>0r(A^n)>0矛盾。因此,存在正整數1pn11\leqslant p\leqslant n-1使得r(Ap)=r(Ap+1)r(A^p)=r(A^{p+1})r(Ap+1)=r(Ap)=r[OAp]=列變換r[Ap+1Ap]r(A^{p+1})=r(A^p)=r\begin{bmatrix}O&A^p\end{bmatrix}\overset{\text{列變換}}{=}r\begin{bmatrix}A^{p+1}&A^p\end{bmatrix}根據定理21(見後文),存在矩陣YY使得Ap+1Y=ApA^{p+1}Y=A^p,兩端左乘AnpA^{n-p}得到An+1Y=AnA^{n+1}Y=A^nr(An)=r[OAn]=列變換r[An+1An]=r[An+1An+1Y]=列變換r[An+1O]=r(An+1)\begin{aligned}r(A^n)&=r\begin{bmatrix}O&A^n\end{bmatrix}\\&\overset{\text{列變換}}{=}r\begin{bmatrix}A^{n+1}&A^n\end{bmatrix}\\&=r\begin{bmatrix}A^{n+1}&A^{n+1}Y\end{bmatrix}\\&\overset{\text{列變換}}{=}r\begin{bmatrix}A^{n+1}&O\end{bmatrix}\\&=r(A^{n+1})\end{aligned}如果式Ap+1Y=ApA^{p+1}Y=A^p兩端左乘AmpA^{m-p}並運用同樣的初等變換,就得證任意mnm\geqslant nr(Am)=r(Am+1)r(A^m)=r(A^{m+1}),因此結論成立。證畢。

【關於公式9的進一步討論】
實際上,關於AFn×nA\in F^{n\times n}的冪的秩隨冪指數增加時的變化規律,我們可以知道更多。

  • 引理:設AA是方陣,若對正整數pp成立r(Ap)=r(Ap+1)r(A^p)=r(A^{p+1}),那麼r(Ap)=r(Ap+1)=r(Ap+2)=...r(A^p)=r(A^{p+1})=r(A^{p+2})=...
    證:仿照公式9法2後半部分的證明思路即可。
    【注】這個結論說明,隨着冪指數從1開始增加,如果AA的冪的秩存在衰減,那麼衰減一定是從一開始就發生,並且是連續發生的,直到它達到最小值。此後AA的冪的秩不再變化。舉個例子,如果成立r(A)=r(A2)r(A)=r(A^2),那麼一定也成立r(A)=r(A2)=r(A3)=...r(A)=r(A^2)=r(A^3)=...
  • 公式9的加強版:設AFn×nA\in F^{n\times n}r(A)=rr(A)=r,則存在正整數p0r+1p_0\leqslant r+1,使得r(A)>r(A2)>...>r(Ap0)=r(Ap0+1)=r(Ap0+2)=...r(A)>r(A^2)>...>r(A^{p_0})=r(A^{p_0+1})=r(A^{p_0+2})=...;特別地,若p0=r+1p_0=r+1,則對k=1,2,...,rk=1,2,...,rr(Ak)=rk+1r(A^k)=r-k+1,且0=r(Ar+1)=r(Ar+2)=r(Ar+3)=...0=r(A^{r+1})=r(A^{r+2})=r(A^{r+3})=...
    證:
    考慮不等式鏈r=r(A)r(A2)...r(Ar)r(Ar+1)r(Ar+2)r=r(A)\geqslant r(A^2)\geqslant...\geqslant r(A^{r})\geqslant r(A^{r+1})\geqslant r(A^{r+2}),式中的\geqslant不可能全部取>>,因此存在正整數1lr+11\leqslant l\leqslant r+1使得r(Al)=r(Al+1)r(A^l)=r(A^{l+1})。根據引理,有r(Al)=r(Al+1)=r(Al+2)=...r(A^l)=r(A^{l+1})=r(A^{l+2})=...,又lr+1l\leqslant r+1,故r(Ar+1)=r(Ar+2)r(A^{r+1})=r(A^{r+2})。這就證明了p0r+1p_0\leqslant r+1
    p0p_0的定義,有r(A)>r(A2)>...>r(Ap0)=r(Ap0+1)r(A)>r(A^2)>...>r(A^{p_0})=r(A^{p_0+1})。於是根據引理,有r(A)>r(A2)>...>r(Ap0)=r(Ap0+1)=r(Ap0+2)=...r(A)>r(A^2)>...>r(A^{p_0})=r(A^{p_0+1})=r(A^{p_0+2})=...
    p0=r+1p_0=r+1,則r=r(A)>r(A2)>...>r(Ar)>r(Ar+1)r=r(A)>r(A^2)>...>r(A^{r})>r(A^{r+1}),顯然式中相鄰兩項至多相差1(否則將導致r(Ar+1)<0r(A^{r+1})<0),又根據>>知式中相鄰兩項恰好相差1。所以對k=1,2,...,rk=1,2,...,rr(Ak)=rk+1r(A^k)=r-k+1,且0=r(Ar+1)=r(Ar+2)=r(Ar+3)=...0=r(A^{r+1})=r(A^{r+2})=r(A^{r+3})=...

此外,在實際的例子中常常看到,每當冪指數增加1,方陣的冪的秩最多減小1,這可能給我們一個錯誤的印象:r(Ak+1)r(Ak)1r(A^{k+1})\geqslant r(A^k)-1。然而實際上,如果對方陣BB成立r(Bk+1)=r(Bk)1r(B^{k+1})=r(B^k)-1,那麼構造一分塊對角矩陣A=[BOOB]A=\begin{bmatrix}B&O\\O&B\end{bmatrix},顯然有r(Ak+1)=r(Ak)2r(A^{k+1})=r(A^k)-2。如果考慮一個由mmBB構成的分塊對角陣AA,那麼r(Ak+1)=r(Ak)mr(A^{k+1})=r(A^k)-m。也就是說,r(Ak+1)r(A^{k+1})可能比r(Ak)r(A^k)小很多。
關於方陣的冪的秩的徹底討論,需要參照Jordan標準形的相關結論。不過,利用Shur分解可以做到更詳細(雖然不夠徹底),請參考後面的博客(鏈接)。


常見相關推論

同解方程組、冪等矩陣的充要條件、對合矩陣的充要條件等。

  • 定理21:矩陣方程AX=BAX=B有解的充要條件爲r(A)=r[AB]r(A)=r\begin{bmatrix}A&B\end{bmatrix}
    證:
    法1:分塊矩陣的角度
    必要性:r[AB]=r[AAX]=列變換r[AO]=r(A)r\begin{bmatrix}A&B\end{bmatrix}=r\begin{bmatrix}A&AX\end{bmatrix}\overset{\text{列變換}}{=}r\begin{bmatrix}A&O\end{bmatrix}=r(A)
    充分性:設B=[β1β2...βn]B=\begin{bmatrix}\beta_1&\beta_2&...&\beta_n\end{bmatrix},其中βi\beta_i爲B的列向量,由r(A)r[Aβi]r[AB]=r(A)r(A)\leqslant r\begin{bmatrix}A&\beta_i\end{bmatrix}\leqslant r\begin{bmatrix}A&B\end{bmatrix}=r(A)r[Aβi]=r(A)r\begin{bmatrix}A&\beta_i\end{bmatrix}=r(A),故線性方程組Ax=βiAx=\beta_i有解xix_i,令X=[x1x2...xn]X^*=\begin{bmatrix}x_1&x_2&...&x_n\end{bmatrix},易見XX^*AX=BAX=B的一個解。
    法2:向量組的角度
    設A的列向量組爲(I),B的列向量組爲(II),則AX=BAX=B有解就等價於(II)可由(I)線性表示,故由定理16知AX=BAX=B有解的充要條件爲r(I)=r(I,II)r(\textrm{I})=r(\textrm{I,II}),即r(A)=r[AB]r(A)=r\begin{bmatrix}A&B\end{bmatrix}
  • 定理22Am×nx=0A_{m\times n}x=0Bm×nx=0B_{m\times n}x=0同解的充要條件爲r(A)=r(B)=r[AB]r(A)=r(B)=r\begin{bmatrix}A\\B\end{bmatrix}
    證:
    必要性:因爲Ax=0Ax=0Bx=0Bx=0同解,故Ax=0Ax=0Bx=0Bx=0有相同的基礎解系,其所含解向量個數爲nr(A)=nr(B)n-r(A)=n-r(B),故r(A)=r(B)r(A)=r(B)。容易看出在已知條件下Ax=0Ax=0[AB]x=0\begin{bmatrix}A\\B\end{bmatrix}x=0也同解,故r(A)=r[AB]r(A)=r\begin{bmatrix}A\\B\end{bmatrix}。綜上,結論成立。
    充分性:取[AB]x=0\begin{bmatrix}A\\B\end{bmatrix}x=0的一個基礎解系U,則U含有nr[AB]=nr(A)n-r\begin{bmatrix}A\\B\end{bmatrix}=n-r(A)個向量,且U是Ax=0Ax=0的一個線性無關解組。由定理13知,U是Ax=0Ax=0的一個基礎解系,故[AB]x=0\begin{bmatrix}A\\B\end{bmatrix}x=0Ax=0Ax=0同解。同理可證[AB]x=0\begin{bmatrix}A\\B\end{bmatrix}x=0Bx=0Bx=0同解。綜上,有Am×nx=0A_{m\times n}x=0Bm×nx=0B_{m\times n}x=0同解。
  • 定理23:Ax=0Ax=0Bx=0Bx=0同解的充要條件爲A和B的行向量組等價
    證:
    必要性:由定理22,r(A)=r(B)=r[AB]r(A)=r(B)=r\begin{bmatrix}A\\B\end{bmatrix},故r(AT)=r[ATBT]r(A^T)=r\begin{bmatrix}A^T&B^T\end{bmatrix}r(BT)=r[BTAT]r(B^T)=r\begin{bmatrix}B^T&A^T\end{bmatrix},進而由定理21知矩陣方程ATX=BTA^TX=B^TBTY=ATB^TY=A^T有解,故ATA^TBTB^T的列向量組等價,即A和B的行向量組等價。
    充分性:將必要性的證明反過來即可。
    【注】實際上,學習了線性空間的知識就知道,Ax=0Ax=0Bx=0Bx=0同解意味着A與B有相同的零空間,由於對任意矩陣C,R(CH)=N(C)R(C^H)=N(C)^\bot,故AHA^HBHB^H有相同的列空間,進而ATA^TBTB^T有相同的列空間,即AABB有相同的行空間,於是自然就有AABB的行向量組等價。反之也成立。線性空間的相關結論可參考矩陣論(零):線性代數基礎知識整理(4)——線性空間與線性變換
  • 定理24:設B是m×nm\times{n}矩陣,若r(AB)=r(B)r(AB)=r(B),則關於x的齊次線性方程組ABx=0ABx=0Bx=0Bx=0是同解方程組
    證:
    法1:考慮基礎解系
    顯然Bx=0Bx=0的解都是ABx=0ABx=0的解。取方程Bx=0Bx=0的一個基礎解系C,則C包含nr(B)n-r(B)個向量,即nr(AB)n-r(AB)個向量,且C是ABx=0ABx=0的一個線性無關解組。由於ABx=0ABx=0的任一基礎解系包含nr(AB)n-r(AB)個向量,由定理13知,C是ABx=0ABx=0的一個基礎解系,得證。
    法2:利用定理22
    r[ABB]=行變換r[OB]=r(B)r\begin{bmatrix}AB\\B\end{bmatrix}\overset{\text{行變換}}{=}r\begin{bmatrix}O\\B\end{bmatrix}=r(B),結合已知得r(AB)=r(B)=r[ABB]r(AB)=r(B)=r\begin{bmatrix}AB\\B\end{bmatrix},於是由定理22知結論成立。
  • 定理25:n階方陣AA是冪等矩陣的充要條件爲r(A)+r(IA)=nr(A)+r(I-A)=n
    證:
    必要性:由A2=AA^2=AA(IA)=OA(I-A)=O,於是根據Sylvester不等式(公式3)有r(A)+r(IA)nr(A(IA))=0r(A)+r(I-A)-n\leqslant r(A(I-A))=0,即r(A)+r(IA)nr(A)+r(I-A)\leqslant n。又根據公式1可得r(A)+r(IA)r(A+IA)=r(I)=nr(A)+r(I-A)\geqslant r(A+I-A)=r(I)=n,故r(A)+r(IA)=nr(A)+r(I-A)=n
    充分性:利用分塊矩陣的初等變換。n=r(A)+r(IA)=r[AOOIA]=行變換r[AOAIA]=列變換r[AAAI]=行變換r[OAIAI]=行變換r[(AI)AOAI]=列變換r[(AI)AOOI]=n+r((AI)A)\begin{aligned}n&=r(A)+r(I-A)=r\begin{bmatrix}A&O\\O&I-A\end{bmatrix}\\&\overset{\text{行變換}}{=}r\begin{bmatrix}A&O\\A&I-A\end{bmatrix}\overset{\text{列變換}}{=}r\begin{bmatrix}A&A\\A&I\end{bmatrix}\\&\overset{\text{行變換}}{=}r\begin{bmatrix}O&A-I\\A&I\end{bmatrix}\overset{\text{行變換}}{=}r\begin{bmatrix}-(A-I)A&O\\A&I\end{bmatrix}\\&\overset{\text{列變換}}{=}r\begin{bmatrix}-(A-I)A&O\\O&I\end{bmatrix}=n+r((A-I)A)\end{aligned}r((AI)A)=0r((A-I)A)=0(AI)A=O(A-I)A=OA2=AA^2=A,即AA是冪等的。
  • 定理26:n階方陣AA是對合矩陣的充要條件爲r(I+A)+r(IA)=nr(I+A)+r(I-A)=n
    證:
    法1:利用對合矩陣與冪等矩陣間的關係
    引理:n階方陣AA是對合矩陣的充要條件爲B=12(IA)B=\frac{1}{2}(I-A)是冪等矩陣(根據定義驗證即可)
    由引理和定理25知n階方陣AA是對合矩陣的充要條件爲r(12(IA))+r(12(I+A))=r(I+A)+r(IA)=nr(\frac{1}{2}(I-A))+r(\frac{1}{2}(I+A))=r(I+A)+r(I-A)=n
    法2:採用與定理25相同的證明思想
    (略)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章