數值分析讀書筆記（2）求解線性代數方程組的直接方法

1.引言

矩陣的數值計算一般可以分爲直接法和間接法

本章主要介紹 $A x = b$ 這類線性方程組求解的直接法，數值求解該方程組的基礎思想是Gauss消元法

實質是通過一組滿秩的初等行變換，將A保秩變換成一個三角矩陣U，此變換過程稱爲矩陣A的非奇異上三角化

我們的目的就是尋求一個矩陣P，使得PA=U，其中U是一個三角矩陣，其中 $A x = b$ 和 $U x = \bar{b}$ 同解（ $\bar{b} = P b$ ）,有效的生成一個P是我們主要研究的問題

2.初等下三角矩陣–Guass變換矩陣

回顧一下線性代數中的三個初等線性變換
- 數乘
- 倍加
- 互換

我們引入一個一般意義上的初等變換矩陣，它把許多常用的線性變換統一在一個框架裏面，在數值線性代數中起着重要的意義

Def：稱 $C^{n \times n}$ 中如下形式的矩陣 $E (u, v; σ)$ 爲初等矩陣:

E (u, v; σ) = I - σ u v^{H}

其中非零向量

u, v \in C^{n}, σ \neq 0

是實或者複數，即

E (u, v; σ) = (\begin{matrix} 1 - σ u_{1} v_{1} & - σ u_{1} v_{2} & \dots & - σ u_{1} v_{n} \\ - σ u_{2} v_{1} & 1 - σ u_{2} v_{2} & \dots & - σ u_{2} v_{n} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ - σ u_{n} v_{1} & - σ u_{n} v_{2} & \dots & 1 - σ u_{n} v_{n} \end{matrix})

選取不同的

u ， v ， σ

，可以得到許多常用的線性變換矩陣

數乘（ $E_{1} = E (e_{i}, e_{i}; 1 - α)$ ）
倍加（ $E_{2} = E (e_{i}, e_{j}; - μ)$ ）
互換（ $E_{3} = E (e_{i} - e_{j}, e_{i} - e_{j}; 1)$ ）

下面引出初等變換矩陣的一些重要的數學性質
1.兩相同向量u，v組成的初等變換矩陣可交換，其積仍然爲一個初等矩陣

E (u, v; σ) E (u, v; τ) = E (u, v; σ + τ - σ τ v^{H} u)

證明：

\begin{aligned} (6) & E (u, v; σ) E (u, v; τ) & = (I - σ u v^{H})) (I - τ u v^{H}) \\ (7) & = I - σ u v^{H} - τ u v^{H} + \end{aligned}

2.若 $1 - σ v^{H} u \neq 0$ ,則初等矩陣E(u,v;\sigma)可逆，其逆矩陣也是初等矩陣

E^{- 1} (u, v; σ) = E (u, v; τ), τ = \frac{σ}{σ v^{H} u - 1}

3.設 $v^{⊥}$ 表示和 $v$ 正交的（n-1）維子空間
a.若 $u \notin v^{⊥}$ ,則 $E (u, v; σ)$ 有n個線性無關的特徵向量，該組特徵向量由u和 $v^{⊥}$ 中任取一組基向量組成
b.若 $u \in v^{⊥}$ ,則 $E (u, v; σ)$ 僅有n-1個線性無關的特徵向量，該組特徵向量由 $v^{⊥}$ 中任取一組基向量組成

4. $d e t (E (u, v; σ)) = 1 - σ v^{H} u$

5.對任意非零向量 $a, b \in C^{n}$ ,必可適當選取 $u, v, σ$ 使得

E (u, v; σ) a = b

事實上只需要取 $u, v, σ$ 滿足
$v^{H} a \neq 0, σ u = \frac{a - b}{v^{H} a}$

由初等變換矩陣引出Guass變換矩陣，我們選取

σ = - 1, u = l_{k} = (0, \dots, 0, l_{k + 1}, \dots, l_{n k})^{T}, v = e_{k} = (0, \dots, 0, 1, 0, \dots, 0)^{T}, k = 1, 2, \dots, n - 1

得到n-1個Guass變換矩陣

L_{k} (l_{k}) \equiv E (l_{k}, e_{k}; - 1) = I + l_{k} e_{k} = (\begin{matrix} 1 \\ ⋱ \\ 1 \\ l_{k + 1, k} & 1 \\ l_{k + 2, k} & 1 \\ ⋮ & ⋱ \\ l_{"} n k & 1 \end{matrix})

下面給出Guass變換矩陣的一些性質

1. $d e t (L_{k}) = 1 + e_{k}^{T} l_{k} = 1$

2.Guass變換矩陣的逆只需要將 $σ$ 從-1變成+1

3. $L_{1} (l_{1}) L_{2} (l_{2}) \dots L_{n - 1} (l_{n - 1}) = (\begin{matrix} 1 \\ l_{21} & 1 \\ l_{31} & l_{32} & 1 \\ ⋮ & ⋮ & ⋮ & ⋱ \\ l_{n 1} & l_{n 2} & l_{n 3} & \dots & 1 \end{matrix})$

注意左乘的順序

3.Gauss消元法

先介紹一下順序Gauss消元法，大概分兩步
- 消元過程
- 回代過程

在消元過程中，我們不斷去左乘Gauss變換矩陣，不斷將原矩陣的下三角部分一列列變成0，從而最終變換成一個上三角矩陣

需要注意的是，在一列列的消元過程中，我們需保證 $a_{i i} \neq 0 (i = 1, 2, \dots, n)$ ,所以需要利用行互換來保證此條件

當然這一切消元過程的前提是，矩陣A應該是非奇異的

經過n-1次的Gauss消元，我們可以得到一個上三角矩陣

L_{n - 1}^{- 1} \dots L_{k}^{- 1} \dots L_{2}^{- 1} L_{1}^{- 1} A^{(1)} = A^{(n)} x = L_{n - 1}^{- 1} \dots L_{k}^{- 1} \dots L_{2}^{- 1} L_{1}^{- 1} b^{(1)} = b^{(n)}

在回代過程中，由於我們得到了一個上三角矩陣，那麼就可以從最底行開始逐步解出x

Gauss消元法的複雜度是 $O (n^{3})$ ，高階狀態下比起克拉默法則運算量要小得多

Gauss消元法過程中，在對各列進行消元的時候，如果主元比較小的話，運算的結果會產生較大的誤差，故引入Gauss列主元消元法，即在每一次利用主元消元的步驟之前，把該列中絕對值最大的數所在的行與主元所在的行進行交換

4.三角分解法

我們利用Gauss變換矩陣對Gauss消元法進行進一步的分析

L_{n - 1}^{- 1} \dots L_{k}^{- 1} \dots L_{2}^{- 1} L_{1}^{- 1} A^{(1)} x = A^{(n)} x = U x

故

\begin{aligned} (8) & A & = L_{1} \dots L_{k} \dots L_{n - 2} L_{n - 1} U \\ (9) & = (I + l_{1} e_{1}^{T}) \dots (I + l_{n - 2} e_{n - 2}^{T}) (I + l_{n - 1} e_{n - 1}^{T}) U \\ (10) & = (I + l_{1} e_{1}^{T} + \dots + l_{n - 1} e_{n - 1}^{T}) U \end{aligned}

由此引出矩陣的LU分解，又稱Doolittle分解

A = (\begin{matrix} 1 \\ l_{21} & 1 \\ l_{31} & l_{32} & 1 \\ ⋮ & ⋮ & ⋮ & ⋱ \\ l_{n 1} & l_{n 2} & l_{n 3} & \dots & 1 \end{matrix}) (\begin{matrix} u_{11} & u_{12} & u_{13} & \dots & u_{1 n} \\ u_{22} & u_{23} & \dots & u_{2 n} \\ u_{33} & \dots & u_{3 n} \\ ⋱ & ⋮ \\ u_{n n} \end{matrix})

這裏再介紹一下Crout分解，即A=LU中的L是一個下三角矩陣，U是單位上三角矩陣

注意到某些特殊矩陣的三角分解也是比較特殊的，這裏引入一類帶狀對角形矩陣

A = (\begin{matrix} a_{11} & \dots & a_{1, s + 1} \\ ⋮ & ⋱ & ⋱ \\ a_{r + 1, 1} & a_{r + 1, s + 1} & a_{n - s, n} \\ ⋱ & ⋱ \\ a_{n, n - r} & a_{n n} \end{matrix})

上半帶寬爲s，下半帶寬爲r，存在LU分解，其中L是下半帶寬爲r的單位下三角矩陣，U是上半帶寬爲s的上三角矩陣

對於r=s=1的這一類更加特殊的矩陣，稱爲三對角矩陣，對於此類矩陣的三角分解，介紹一種“追趕法”

首先做Crout分解

A = L U = (\begin{matrix} p_{1} & 0 \\ r_{2} & p_{2} \\ ⋱ & ⋱ \\ r_{n - 1} & p_{n - 1} \\ 0 & r_{n} & p_{n} \end{matrix}) (\begin{matrix} 1 & q_{1} & 0 \\ 1 & q_{2} \\ ⋱ & ⋱ \\ 1 & q_{n - 1} \\ 0 & 1 \end{matrix})

然後分兩步解決此類問題
追：解

L y = b

趕：解

U x = y

注意到正定對稱矩陣的三角分解也是特殊的，這裏引入Cholesky分解

首先利用Doolittle分解，得 $A = L U$ ,對U進一步提取對角矩陣 $d i a g (u_{11}, \dots, u_{n n})$ ,從而有

U = D D^{- 1} U = D (D^{- 1} U) = D U_{0}

故，

A = L D U_{0}

，由於A對稱正定，

A^{T} = A

,所以有

A^{T} = (L D U_{0})^{T} = U_{0}^{T} D L^{T} = A = L D U_{0}

由於分解的唯一性，可知

L^{T} = U_{0}

，從而有

A = L D L^{T}

我們可以記，

D^{1 / 2} = d i a g (\sqrt{u_{11}}, \dots, \sqrt{u_{n n}})

,從而

A = L D^{1 / 2} D^{1 / 2} L^{T} = L D^{1 / 2} (L D^{1 / 2})^{T} = L_{1} L_{1}^{T}

此種分解手段稱爲Cholesky分解，限定對角元素爲正，此類分解唯一

上述的Cholesky分解中涉及了開方的運算，下面介紹一種改進的平方根法

易知， $A = L D L^{T}$ ,則 $A x = L D L^{T} x$

先解 $L y = b$ ,後解 $L^{T} x = D^{- 1} y$ ,其中D的逆只需要將對角元素取倒數即可

5.向量和矩陣的範數

範數是比長度更爲一般的概念，有了範數就可以更好的去測度誤差的大小

關於向量範數

$D e f : V 是數域 R / C 上的線性空間，對於 V 中任意的元素 x ， i f 存在一個唯一的實函數 N （ x ）與之對應，記爲 ‖ \begin{matrix} x \end{matrix} ‖, 而且需滿足三個條件 1. 非負正定， 2. 齊次性， 3. 三角不等式$

對於非負正定，當僅當x=0，有N（x）=0，否則N（x）> 0;

對於齊次性，有

‖ \begin{matrix} α x \end{matrix} ‖ = | \begin{matrix} α \end{matrix} | ‖ \begin{matrix} x \end{matrix} ‖, α \in K

對於三角不等式，有

‖ \begin{matrix} x + y \end{matrix} ‖ \leq ‖ \begin{matrix} x \end{matrix} ‖ + ‖ \begin{matrix} y \end{matrix} ‖, \forall x, y \in V

這裏介紹幾種常見的向量範數

$l_{1} - 范数$ 向量中的元素的絕對值之和
$l_{2} - 范数$ 向量中的元素的絕對值的平方加起來然後開方
$l_{\infty} - 范数$ 向量元素中的最大絕對值（使用Cauchy-Schwarz不等式證明三角不等式）
$l_{p} - 范数$ 向量中的元素的絕對值的p次方加起來然後開p次方根（利用赫爾德不等式即可證明三角不等式）

在最優化理論中可能會涉及加權範數，A爲對稱正定矩陣， $(x^{T} A x)^{1 / 2}$ 是一種向量範數，記爲 ${‖ \begin{matrix} x \end{matrix} ‖}_{A}$

在無限維線性空間中，比如在[a,b]區間中，對於所有的實連續函數集合C[a,b],對於其中的一個元素f(x)也是有類似定義的範數

1範數
${‖ \begin{matrix} f (x) \end{matrix} ‖}_{1} = \int_{a}^{b} | \begin{matrix} f (x) \end{matrix} | d x$
p範數
${‖ \begin{matrix} f (x) \end{matrix} ‖}_{p} = {(\int_{a}^{b} {| \begin{matrix} f (x) \end{matrix} |}^{p} d x)}^{\frac{1}{p}}$
∞範數
${‖ \begin{matrix} f (x) \end{matrix} ‖}_{\infty} = m a x | \begin{matrix} f (x) \end{matrix} |, a \leq x \leq b$

下面介紹一下範數的等價性

對於任意兩個定義好的範數，存在兩個與向量x無關的非零正常數c1，c2，有

$c_{1} {‖ \begin{matrix} x \end{matrix} ‖}_{α} \leq {‖ \begin{matrix} x \end{matrix} ‖}_{β} \leq c_{2} {‖ \begin{matrix} x \end{matrix} ‖}_{α}$
稱兩個範數等價

不難驗證，此處的等價性滿足數學定義中的等價性的三個條件，即自反，對稱，傳遞

關於矩陣範數

矩陣範數不僅僅滿足非負正定，齊次和三角不等式，而且須滿足矩陣相乘的相容性，即

‖ \begin{matrix} A B \end{matrix} ‖ \leq ‖ \begin{matrix} A \end{matrix} ‖ ‖ \begin{matrix} B \end{matrix} ‖

這裏給出一類特殊的範數， Frobenius範數

{‖ \begin{matrix} A \end{matrix} ‖}_{F} = {(\sum_{j = 1}^{m} \sum_{i = 0}^{n} {| \begin{matrix} a_{i j} \end{matrix} |}^{2})}^{\frac{1}{2}}

對於 $C^{m \times n}$ 上面的任意一種向量誘導範數，都有 $‖ \begin{matrix} I \end{matrix} ‖ = max_{‖ \begin{matrix} x \end{matrix} ‖ = 1} {‖ \begin{matrix} I x \end{matrix} ‖ = 1}$

這裏給出一種範數的定義，即誘導矩陣範數，誘導矩陣範數和向量範數密切相關

定義：設在兩個向量空間 $C^{m}, C^{n}$ 中存在向量範數 ${‖ \begin{matrix} ∙ \end{matrix} ‖}_{V}$ , 定義在 $C^{m \times n}$ 空間上的矩陣A的由向量範數 ${‖ \begin{matrix} ∙ \end{matrix} ‖}_{V}$ 誘導所給出的矩陣範數爲（其中x不爲零向量）
${‖ \begin{matrix} A \end{matrix} ‖}_{V} = m a x \frac{{‖ \begin{matrix} A x \end{matrix} ‖}_{V}}{{‖ \begin{matrix} x \end{matrix} ‖}_{V}}$

我們爲了解決這個最大值的問題，繼續等價定義來優化這個問題

${‖ \begin{matrix} A \end{matrix} ‖}_{V} = m a x \frac{{‖ \begin{matrix} A x \end{matrix} ‖}_{V}}{{‖ \begin{matrix} x \end{matrix} ‖}_{V}} = m a x {‖ \begin{matrix} A x \end{matrix} ‖}_{V}$
其中第一個max條件爲x不爲零向量，第二個max條件爲 ${‖ \begin{matrix} x \end{matrix} ‖}_{V} = 1$

我們利用誘導範數的定義可以從原來的向量範數中誘導出三種範數，分別是

1範數：對矩陣的每一列中的元素取絕對值之後求和，然後選取其中的最大列作爲1範數
2範數：矩陣的最大奇異值，也就是矩陣與矩陣的轉置的乘積的最大特徵值
無窮範數：對於矩陣的每一行的元素取絕對值之後求和，然後選取其中的最大行作爲無窮範數

關於矩陣的應用，這裏引入一個Banach引理

設矩陣A屬於n*m的復矩陣空間，對於該空間上的某種矩陣範數 ${‖ \begin{matrix} ∙ \end{matrix} ‖}_{V}$ ,有 ${‖ \begin{matrix} A \end{matrix} ‖}_{V} < 1$ ,則矩陣 $（ I \pm A ）$ 非奇異，且有
${‖ \begin{matrix} (I - A)^{- 1} \end{matrix} ‖}_{V} \leq \frac{‖ \begin{matrix} I \end{matrix} ‖}{1 - ‖ \begin{matrix} A \end{matrix} ‖}$

給出矩陣譜半徑的定義

矩陣的譜半徑爲矩陣的最大特徵值，關於矩陣的譜半徑，它不超過其任意一種矩陣範數（當矩陣是Hermite矩陣時，矩陣的2範數恰好等於矩陣的譜半徑）

繼續給出線性方程組中條件數的定義

在某一矩陣空間中，對於某一矩陣範數，矩陣的條件數=矩陣的範數×矩陣的逆的範數，即

$C o n d (A) = {‖ \begin{matrix} A \end{matrix} ‖}_{V} \times {‖ \begin{matrix} A^{- 1} \end{matrix} ‖}_{V}$

對於矩陣的條件數來說，它顯然大於等於1，當矩陣恰好是正交矩陣的時候，矩陣的條件數恰好等於1
當矩陣爲對稱陣，對應的矩陣範數爲2範數的時候，此時的條件數稱之爲譜條件數，其值等於最大特徵值除以最小特徵值，然後取絕對值

數值分析讀書筆記（2）求解線性代數方程組的直接方法

數值分析讀書筆記（2）求解線性代數方程組的直接方法

1.引言

2.初等下三角矩陣–Guass變換矩陣

3.Gauss消元法

4.三角分解法

5.向量和矩陣的範數

關於向量範數

關於矩陣範數

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

Effective.Java 讀書筆記（6）內存泄漏

數值分析讀書筆記（5）數值逼近問題(I)----插值極其數值計算

Attention is All You Need 論文筆記

Vue學習筆記（1）一開始的使用以及Vue實例的詳解

數值分析讀書筆記（3）求解線性代數方程組的迭代法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結