5第五章空間插值與克里格法

對自然各種屬性的測量只能得到有限樣本點的值，不可能對每個點都進行採樣，然而我們總是想知道未測點的值，因此，就需要根據實測得到的離散數據，對未知點進行預測

想要獲得上圖，需要各種空間插值方法，大多數插值方法都可被看作是數據的加權平均數，有如下通用公式:
$Z^*(x_0)=\sum_{i=1}^N\lambda_iZ(x_i)$
如何分配權重是關鍵問題，多數空間插值方法只考慮到系統的或確定的變異，而沒有考慮到其誤差，地統計的克里格方法，不但能描述空間變異的分佈特徵，而且能夠表達預測誤差

5.1主要空間插值法介紹

確定性方法：基於實測數據的相似性程度或平滑程度，利用數學函數進行插值（如逆距離加權法）

地統計方法：利用實測數據的統計特性來量化其空間自相關程度，生產插值面並評價預測的不確定性

整體插值法：利用整個實測數據集來預測

局部插值法：在大面積的研究區域上選取較小的空間單元，利用預測點周圍的臨近樣點來進行預測

精確性插值：實測點的預測值等於實測值

不精確插值：實測點的預測值不等於實測值

5.1.1空間整體插值法

1.全局多項式插值法(趨勢面分析法):即用數學公式表達感興趣區域上的一種漸變的趨勢

平面: $f(x_i,y_i)=b_0+bx_i+b_2y_i$

曲面: $f(x_i,y_i)=b_0+b_1x_i+b_2y_i+b_3x_i^2+b_4y_i^2+b_5x_iy_i$

多項式中的參數係數往往用最小二乘法求解。但該方法是不精確的插值方法，很少有實測點剛好在生產的插值面上，而是或高或低於插值面，高低數值相加，之和近似爲0。

什麼地理屬性適合用全局多項式插值法進行空間插值？

全局多項式插值法的插值結果往往呈條帶狀（左圖），適合於描述那些呈明顯趨勢分佈的屬性，不適合描述那些空間分佈波動較大（較破碎，右圖）的自然屬性

空間交互性的比較強造成空間連續性較強

2.變換函數插值法：根據一個或多個空間參量的經驗方程進行整體空間插值，這種經驗方程稱爲變換函數。即用與被預測屬性相關的其他屬性建立迴歸方程，進行空間預測
$z(x)=b_0+b_1p_1+b_2p_2+\varepsilon$
$b_0,b_1,b_2$ 爲迴歸係數， $p_1,p_2$ 爲獨立空間變量， $z(x)$ 爲被預測屬性，是一種土壤景觀定量模型算法

該方法對相關屬性 $p$ 有何要求

1. $p$ 與 $z$ 之間顯著相關性

2. $p$ 與 $p$ 之間沒有共線性

3.獲取成本比 $z$ 低

4.全區域覆蓋

3.逆距離加權法(IDW)：利用被預測區域點周圍的實測值來預測未採樣點的值，實測點離預測點越近，則對插值的結果影響越大。

其中 $Z^*(x_0)=\sum_{i=1}^{n}\lambda_iZ(x_i) , \lambda_i=d_{i0}^{-p}/\sum_{i=1}^{N}d_{i0}^{-p}$

p爲實測值對預測值的影響級，若p=0，則每一個權重是一樣的，預測值是所有實測值的平均值，當p增加時，相距較遠的點的權重迅速減小，2最爲常用(也叫逆距離導數加權法)

由於IDW方法只考慮距離進行權重分配，所以臨近實測點的貢獻往往很大，而造成空間分佈的多點中心現象

討論

IDW方法是否適用於三維空間或時空插值？爲什麼？舉例說明

z軸與xy軸上變異程度相差很大，pm2.5在平面空間上連續較強，若第三維是時間上，則差距是比較大的，如果是時空維，還要考慮到距離變換的問題，例如土壤重金屬離污染源距離成相關，會隨地表徑流深入到地下，影響深層次土壤污染，深入到地下，滲透速度與平面上的傳播速度要小得多，滲透深度是1m左右，周邊5km會造成重金屬的累積，高程之間的差異，深度上的1m與平面上的1m是不一樣的，變異程度，第三維上的變異程度與空間維度的變異程度是有很大差距的
如果非要進行IDW怎麼辦？
將時間上的距離與空間上的距離之間的變異程度量化到一個數量級，即分別考慮二者的變異程度，形成一個距離轉換系數，將二者分別計算權重進行套合

4.局部多項式插值法（移動內插法）：多項式插值法將整個區域考慮成一個平面或曲面，而局部多項式插值法是在劃定的領域內（窗口內）用其中的實測數據來擬合不同次數的多項式

5.克里格方法：和IDW一樣，也是一種局部估計的加權平均，但是它對各實測點權重的確定是通過半方差分析獲取的，可分爲線性克里格法和非線性克里格法

總結:

克里格法實質上是利用區域化變量的原始數據和變異函數的結構特點，對未採樣點的區域化變量的取值進行線性無偏最優估計的一種方法，從數學角度講就是一種對空間分佈的數據求線性最優無偏內插估計量的一種方法。是根據待估樣點有限領域內若干已測定的樣點數據，在考慮樣點形狀、大小和空間相互位置關係，它們與待估樣點相互空間位置關係，以及變異函數提供的結構信息之後，對該待估樣點進行的一種線性無偏最優估計

5.2線性預測克里格法

5.2.1普通克里格原理

普通克里格法：假定 $Z(x)$ 是滿足本徵假設的一個隨機過程，該隨機過程有 $n$ 個觀測值 $z(x_i)$ ，要預測未採樣點 $x_0$ 處的值，則線性預測值 $Z*(x_0)$ 可以表示如下：
$Z^*(x_0)=\sum_{i=1}^{n}\lambda_iZ(x_i)$
Kriging是在使預測無偏並有最小方差的基礎上，去確定最優的權重值，滿足以下兩個條件：

(1)無偏性條件： $E[Z^*(x_0)-Z(x_0)]=0$

(2)最優性條件： $var[{Z^*(x_0)-Z(x_0)}]=min$
$E\left[Z *\left(x_{0}\right)-Z\left(x_{0}\right)\right]=E\left[\sum_{i=1}^{n} \lambda_{i} z\left(x_{i}\right)-Z\left(x_{0}\right)\right]=\sum_{i=1}^{n} \lambda_{i} E\left[Z\left(x_{i}\right)\right]-E\left[Z\left(x_{0}\right)\right]$
根據本徵假設 $E[Z(x_i)]=E[Z(x_0)]=m$

上式進一步表示爲 $\sum_{i=1}^{n} \lambda_{i} E\left[Z\left(x_{i}\right)\right]-E\left[Z\left(x_{0}\right)\right]=\sum_{i=1}^{n} \lambda_{i} m-m=m\left(\sum_{i=1}^{n} \lambda_{i}-1\right)=0$

因此滿足以下條件: $\sum_{i=1}^{n} \lambda_{i}=1$

在二階平穩假設條件下，協方差與變異函數有如下關係： $γ(h)=C(0)-C(h)$

普通克里格插值的條件如下：
1.在研究區域內，區域化變量 $Z(x)$ 的增量的數學期望對任意 $x$ 和 $h$ 存在且等於0
$E[Z(x)-Z(x+h)]=0$
2.在研究區域內，區域化變量的增量[ $Z(x)-Z(x+h)]$ 的方差對任意x和h存在且平穩
$\operatorname{Var}[Z(x)-Z(x+h)]=E\left[\{Z(x)-Z(x+h)\}^{2}\right]=2 r(h)$
在本證假設條件下
$\begin{array}{l} \operatorname{var}\left[Z^{*}\left(x_{0}\right)-Z\left(x_{0}\right)\right]=E\left[\left\{Z^ *\left(x_{0}\right)-Z\left(x_{0}\right)\right\}^{2}\right]=E\left[\left\{\sum_{i=1}^{n} \lambda_{i} z\left(x_{i}\right)-Z\left(x_{0}\right)\right\}^{2}\right] \\ =2 \sum_{i=0}^{n} \lambda_{i} \gamma\left(x_{i}, x_{0}\right)-\sum_{i=1}^{n} \sum_{j=1}^{n} \lambda_{i} \lambda_{j} \gamma\left(x_{i}, x_{j}\right) \end{array}$

另一種推導方法
$Var(Z^*(x)-Z(x_0))=Var(Z^*(x))-2Cov(Z^*(x),Z(x_0))+Var(-Z(x_0))$
有如下性質：當 $X=\sum_{i=1}^nw_iZ(x_i)$ , $Var(X)=\sum_{i=1}^n\sum_{j=1}^nw_iC(x_i,x_j)w_j$ ,

因此 $Var(Z^*(x))=Var(\sum_{i=1}^n\lambda_iZ(x_i))=\sum_{i=1}^n\sum_{j=1}^n\lambda_i\lambda_jCov(Z(x_i),Z(x_j))$

$Var(X)=Cov(X,X),Cov(aX,bY)=abCov(X,Y)$ ,因此 $Var(-Z(x_0))=Cov(Z(x_0),Z(x_0))$

有 $Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z),Cov(cX,Y)=cCov(X,Y)$ ，因此有

$Cov(Z^*(x),Z(x_0))=Cov(\sum_{i=1}^n\lambda_iZ(x_i),Z(x_0))=\sum_{i=1}^n\lambda_iCov(Z(x_i),Z(x_0))$

因此上式等式可變爲
$Var(Z^*(x)-Z(x_0))=\sum_{i=1}^n\sum_{j=1}^n\lambda_i\lambda_jCov(Z(x_i),Z(x_j))-2\sum_{i=1}^n\lambda_iCov(Z(x_i),Z(x_0))\\+Cov(Z(x_0),Z(x_0))$
定義 $C_{ij}=Cov(Z(x_i),Z(x_j))$

上式變爲：
$Var(Z^*(x)-Z(x_0))=\sum_{i=1}^n\sum_{j=1}^n\lambda_i\lambda_jC_{ij}-2\sum_{i=1}^n\lambda_iC_{i0}+C_{00}$
由於 $γ(h)=C(0)-C(h)$ ，因此 $C_{ij}=C(0)-\gamma_{ij}$

上式進一步變爲
$\sum_{i=1}^n\sum_{j=1}^n\lambda_i\lambda_j(C_{00}-\gamma_{ij})-2\sum_{i=1}^n\lambda_i(C_{00}-\gamma_{i0})+C_{00}=2\sum_{i=1}^n\lambda_i\gamma_{i0}-\sum_{i=1}^n\sum_{j=1}^n\lambda_i\lambda_j\gamma_{ij}\\+C_{00}(1-2\sum_{i=1}^n\lambda_i+\sum_{i=1}^n\sum_{j=1}^n\lambda_i\lambda_j)$
後面那一部分 $C_{00}$ 處等於0

因此最終得到 $2\sum_{i=1}^n\lambda_i\gamma_{i0}-\sum_{i=1}^n\sum_{j=1}^n\lambda_i\lambda_j\gamma_{ij}$

與上面證明相符合

根據方差最小原則，藉助拉格朗日乘子，普通克里格的預測方程組爲
$\left\{\begin{array}{l} \sum_{i=1}^{n} \lambda_{i}=1 \\ \sum_{i=1}^{n} \lambda_{i} \gamma\left(x_{i}, x_{j}\right)-\varphi\left(x_{0}\right)=\gamma\left(x_{j}, x_{0}\right) \end{array}\right.$
(注意是減去 $\phi$ ，原因在後面說明)

老師ppt這裏是 $\phi(x_0)$ ,應該是表達的方式不一樣

預測方差爲
$\sigma^2(x_0)=\sum_{i=1}^n\lambda_i\gamma(x_i,x_0)+\phi\\ =\sum_{i=1}^n\lambda_i(C(0)-C(x_i,x_0))+\phi =\bar{C}(V, V)-\sum_{i=1}^{n} \lambda_{j} \bar{C}\left(x_{i} V\right)+\phi$
與後面計算實例相符合

計算表示如下:

克里格公式也可以用矩陣的形式表示，對點狀克里格，有：(老師的ppt裏這裏是 $\phi$ )
$A \bullet\left[\begin{array}{l} \lambda \\ -\phi \end{array}\right]=B$
對應的矩陣如下：
$\left[\begin{array}{ccccc} \gamma\left(\boldsymbol{x}_{1}, \boldsymbol{x}_{1}\right) & \gamma\left(\boldsymbol{x}_{1}, \boldsymbol{x}_{2}\right) & \cdots & \gamma\left(\boldsymbol{x}_{1}, \boldsymbol{x}_{n}\right) & 1 \\ \gamma\left(\boldsymbol{x}_{2}, \boldsymbol{x}_{1}\right) & \gamma\left(\boldsymbol{x}_{2}, \boldsymbol{x}_{2}\right) & \cdots & \gamma\left(\boldsymbol{x}_{2}, x_{n}\right) & 1 \\ \vdots & \vdots & \cdots & \vdots & \vdots \\ \gamma\left(\boldsymbol{x}_{n}, \boldsymbol{x}_{1}\right) & \gamma\left(\boldsymbol{x}_{n}, \boldsymbol{x}_{2}\right) & \cdots & \gamma\left(\boldsymbol{x}_{n}, \boldsymbol{x}_{n}\right) & 1 \\ 1 & 1 & \cdots & 1 & 0 \end{array}\right] \times\left[\begin{array}{c} \lambda_{1} \\ \lambda_{2} \\ \vdots \\ \lambda_{n} \\ -\phi \end{array}\right]=\left[\begin{array}{c} \gamma\left(\boldsymbol{x}_{1}, \boldsymbol{x}_{0}\right) \\ \gamma\left(\boldsymbol{x}_{2}, \boldsymbol{x}_{0}\right) \\ \vdots \\ \gamma\left(\boldsymbol{x}_{n}, \boldsymbol{x}_{0}\right) \\ 1 \end{array}\right]$
其中 $A$ 是 $x_0$ 周圍的 $n$ 個點距離矩陣並帶入到變異函數中計算所得結果

$B$ 矩陣是預測位置與樣點組成的矩陣帶入到變異函數中計算結果

將克里格估值方程組中的 $\gamma(h)=C(0)-C(h)$ 後，方程組變爲
$\sum_{i=1}^{n} \lambda_{i} \gamma\left(x_{i}, x_{j}\right)-\varphi\left(x_{0}\right)=\gamma\left(x_{j}, x_{0}\right) \\ C(0)-\sum_{i=1}^{n} \lambda_{i} C\left(x_{i}, x_{j}\right)-\varphi\left(x_{0}\right)=C(0)-C\left(x_{j}, x_{0}\right)\\ \sum_{i=1}^{n} \lambda_{i} C\left(x_{i}, x_{j}\right)+\varphi\left(x_{0}\right)=C\left(x_{j}, x_{0}\right)$
因此對應的克里格矩陣又變爲：
$\left[\begin{array}{ccccc} C\left(\boldsymbol{x}_{1}, \boldsymbol{x}_{1}\right) & C\left(\boldsymbol{x}_{1}, \boldsymbol{x}_{2}\right) & \cdots & C\left(\boldsymbol{x}_{1}, \boldsymbol{x}_{n}\right) & 1 \\ C\left(\boldsymbol{x}_{2}, \boldsymbol{x}_{1}\right) & C\left(\boldsymbol{x}_{2}, \boldsymbol{x}_{2}\right) & \cdots & C\left(\boldsymbol{x}_{2}, x_{n}\right) & 1 \\ \vdots & \vdots & \cdots & \vdots & \vdots \\ C\left(\boldsymbol{x}_{n}, \boldsymbol{x}_{1}\right) & C\left(\boldsymbol{x}_{n}, \boldsymbol{x}_{2}\right) & \cdots & C\left(\boldsymbol{x}_{n}, \boldsymbol{x}_{n}\right) & 1 \\ 1 & 1 & \cdots & 1 & 0 \end{array}\right] \times\left[\begin{array}{c} \lambda_{1} \\ \lambda_{2} \\ \vdots \\ \lambda_{n} \\ \phi \end{array}\right]=\left[\begin{array}{c} C\left(\boldsymbol{x}_{1}, \boldsymbol{x}_{0}\right) \\ C\left(\boldsymbol{x}_{2}, \boldsymbol{x}_{0}\right) \\ \vdots \\ C\left(\boldsymbol{x}_{n}, \boldsymbol{x}_{0}\right) \\ 1 \end{array}\right]$
因此計算實例中均是用的如上協方差矩陣計算

證明參考鏈接：
https://xg1990.com/blog/archives/222

https://zh.wikipedia.org/wiki/%E5%8D%8F%E6%96%B9%E5%B7%AE

https://zh.wikipedia.org/wiki/%E5%8D%8F%E6%96%B9%E5%B7%AE%E5%87%BD%E6%95%B0

Solved: EXERCISE: Prove The Following Var(aX+ B) = A2 Var ...

5.2.2普通克里格法實例一

在一個研究區域內， $Z(x)$ 是一個區域化變量，滿足二階平穩和本證假設，其協方差函數 $C(h)$ 和變異函數二階平穩假設存在。設變異函數是一個二維各向同性的球狀模型，見圖.球狀模型的主要參數爲則模型公式爲

設研究區域內有一個未知點 $x_0$ ,其鄰域內有 $x_1 ， x_2 ， x_3 ，x_4$ 已知觀測點，其觀測值分別爲 $Z(x_1 ),Z(x_2),Z(x_3),Z(x_4)$ 。目的是從已知四個點的觀測值中去估計未知點 $x_0$ 的值 $Z(x_0)$ ，見圖.設 $Z(x_0)$ 的普通克里格線性估計量爲

$\left[\begin{array}{l} \lambda_{1} \\ \lambda_{2} \\ \lambda_{3} \\ \lambda_{4} \\ \mu \end{array}\right]=\left[\begin{array}{lllll} C_{11} & C_{12} & C_{13} & C_{14} & 1 \\ C_{21} & C_{22} & C_{23} & C_{24} & 1 \\ C_{31} & C_{32} & C_{33} & C_{34} & 1 \\ C_{41} & C_{42} & C_{43} & C_{44} & 1 \\ 1 & 1 & 1 & 1 & 0 \end{array}\right]^{-1}\cdot\left[\begin{array}{c} C_{01} \\ C_{02} \\ C_{03} \\ C_{04} \\ 1 \end{array}\right]=\left[\begin{array}{ccccc} 22 & 9.84 & 1.22 & 4.98 & 1 \\ 9.84 & 22 & 2.32 & 0.28 & 1 \\ 1.22 & 2.32 & 22 & 0 & 1 \\ 4.98 & 0.28 & 0 & 22 & 1 \\ 1 & 1 & 1 & 1 & 0 \end{array}\right]^{-1}\cdot \left[\begin{array}{c} 12.66 \\ 4.98 \\ 1.72 \\ 9.84 \\ 1 \end{array}\right]=\left[\begin{array}{c} 0.518 \\ 0.022 \\ 0.089 \\ 0.371 \\ 0.969 \end{array}\right]$

$Z_{0}^{\#}=0.518 Z\left(x_{1}\right)+0.022 Z\left(x_{2}\right)+0.089 Z\left(x_{3}\right)+0.371 Z\left(x_{4}\right)$

$\begin{array}{l} \sigma_{K}^{2}=\bar{C}(V, V)-\sum_{i=1}^{n} \lambda_{j} \bar{C}\left(x_{i} V\right)+\mu \\ =22-[(0.518)(12.66)+(0.022)(4.98)+(0.089)(1.72)+(0.371)(9.84)]+0.969 \\ =22-10.473+0.969 \\ =12.496 \end{array}$

當待插值點變換位置如下圖

周圍的點均沒變，因此只需要修改 $B$ 矩陣即可，這樣可以節省計算過程，同時也是爲什麼特別強調野外實際取樣設計應儘可能採用規則格網數據結構的重要原因

5.2.3不規則網絡取樣數據實例

在研究區域內，區域化變量 $Z(x)$ 滿足二階平穩和本徵假設，其協方差函數和變異函數存在，且均爲各向同性的指數模型：
$\begin{array}{l} \gamma(h)=\left\{\begin{array}{ll} 0 & h=0 \\ 10\left(1-\exp \left(\frac{-3 h}{10}\right)\right)& h>0 \end{array}\right. \\ C(h)=\left\{\begin{array}{ll}10 & h=0 \\ 10 \exp \left(\frac{-3 h}{10}\right)& h>0 \end{array}\right. \end{array}$
區域中位置點 $x_0$ ，在其領域內有7個已知不規則分佈的樣點，每一個樣點的座標，樣點的觀測值與位置點 $x_0$ 的距離如表所示

計算過程：

$\lambda=\left[\begin{array}{l} \lambda_{1} \\ \lambda_{2} \\ \lambda_{3} \\ \lambda_{4} \\ \lambda_{5} \\ \lambda_{6} \\ \lambda_{7} \\ \mu \end{array}\right]=\left[\begin{array}{llllllll} C_{11} & C_{12} & C_{13} & C_{14} & C_{15} & C_{16} & C_{17} & 1 \\ C_{21} & C_{22} & C_{23} & C_{24} & C_{25} & C_{26} & C_{27} & 1 \\ C_{31} & C_{32} & C_{33} & C_{34} & C_{35} & C_{36} & C_{37} & 1 \\ C_{41} & C_{42} & C_{43} & C_{44} & C_{45} & C_{46} & C_{47} & 1 \\ C_{51} & C_{52} & C_{53} & C_{54} & C_{55} & C_{56} & C_{57} & 1 \\ C_{61} & C_{62} & C_{63} & C_{64} & C_{65} & C_{66} & C_{67} & 1 \\ C_{71} & C_{72} & C_{73} & C_{74} & C_{75} & C_{76} & C_{77} & 1 \\ 1 & 1 & 1 & 1 & 1 & 1 & 1 & 0 \end{array}\right]^{-1}\left[\begin{array}{c} C_{01} \\ C_{02} \\ C_{03} \\ C_{04} \\ C_{05} \\ C_{06} \\ C_{07} \\ 1 \end{array}\right]\\ =\left[\begin{array}{ccccccc} 10.00 & & & & & & & 1 \\ 5.11 & 10.00 & & & & & & 1 \\ 0.44 & 0.36 & 10.00 & & & & & 1 \\ 0.20 & 0.26 & 2.90 & 10.00 & & & & 1 \\ 0.49 & 0.91 & 0.20 & 0.24 & 10.00 & & & 1 \\ 0.26 & 0.49 & 0.11 & 0.15 & 5.11 & 10.00 & & 1 \\ 0.05 & 0.06 & 0.36 & 1.22 & 0.22 & 0.19 & 10.00 & 1 \\ 1 & 1 & 1 & 1 & 1 & 1 & 1 & 0 \end{array}\right]^{-1}\left[\begin{array}{c} 2.61 \\ 3.39 \\ 0.89 \\ 0.58 \\ 1.34 \\ 0.68 \\ 0.18 \\ 1 \\\end{array}\right]$
未知點的 $x_0$ 估計值：

$\begin{array}{l} Z_{0}^{*}=\sum_{i=1}^{n} \lambda_{i} Z\left(x_{i}\right)=(0.173)(477)+(0.318)(696)+(0.129)(227)+ (0.086)(646)+(0.151)(606)+(0.057)(791)+(0.086)(783) \\ =592.7 \end{array}$

其克里格估計方差爲：

$\begin{aligned} \sigma_{K}^{2}=& \bar{C}(V, V)-\sum_{i=1}^{n} \lambda_{i} \bar{C}\left(x_{i}, V\right)+\mu \\ =& 10-[(0.173)(2.61)+(0.318)(3.39)+(0.129)(0.89)+(0.086)(0.58)+(0.151)(1.34)+(0.057)(0.68)+(0.086)(0.18)]+0.901 \\ =& 10-1.94+0.907 \\ =& 8.967 \end{aligned}$

5.2.4塊段普通克里格

如果估計的不是 $x_0$ 點，而是以 $x_0$ 爲中心快段的平均值，這時要用塊段普通克里格法，由於與上例數據結構不變，因此，克里格矩陣不變，只是矩陣B變爲:

$\left[\begin{array}{l} \bar{C}\left(x_{1} V\right) \\ \bar{C}\left(x_{2} V\right) \\ \bar{C}\left(x_{3} V\right) \\ \bar{C}\left(x_{4} V\right) \\ 1 \end{array}\right]$

其中 $\bar{C}\left(x_{i}, V\right)=C_{0}+C-\frac{1}{V} \iint_{V} \gamma(\sqrt{\left(x_{i}-x\right)^{2}+\left(y_{i}-y\right)^{2}} d x d y$

$V$ 爲塊段面積，窮盡塊狀中每個位置，但積分經常很難解，因此，常常（1）將待估塊段V離散化成若干點，計算已知樣點與塊段V內被離散化的若干個點之間的協方差函數 $C(h)$ 或變異函數 $r(h)$ ，最後求出平均數；（2）除了將待估塊段V離散化外，如果已知樣點也是一個小塊段的支撐構成，將這塊段也離散化成一隻的若干點，計算點與點之間的協方差函數 $C(h)$ 或變異函數 $r(h)$

離散化是一個近似的方法，顯然，離散化越多，得到的平均協方差函數值或變異函數值精度越高，但計算的工作量很大，因此，在離散化時，要考慮精度和工作量的平衡

5.2.5克里格性質及說明

在克里格方程組中，克里格矩陣只取決於已知樣點的相對集合特徵，而與待估樣點或塊段無關，因此，只要兩個數據構型相同時，其克里格矩陣也相同。計算過程中，只需求一次逆矩陣，就可以得到另一個接的列矩陣，如果兩個待估塊段或樣點的幾個特徵也相同，那麼所得克里格權重係數的解得列矩陣也一定相同，鑑於這方面的原因，空間取樣設計時應儘量保證數據構形的系統性和規則性。這樣，就可將單獨一個克里格方案在整個估計中重複使用

克里格估計量是一種線性、無偏最優估計量，而且可以給出估計的方差，它在已知樣點上的估計等於樣點值本身。因而它是真正的空間局部內插法，具有較高的可靠性。許多研究表明，克里格法的精度明顯高於多邊形法、三角形法、局部平均法和距離倒數平法加權法。

克里格權重係數的對稱性

每個樣點的權重係數分別爲 $k1,k2…k7$ ，當區域化變量Z(X)具有各向同性結構時，在圈中係數之間有 $k2=k3,k4=k6.$ 這主要是因爲樣點 $x2$ 與 $x3，x4$ 與 $x6$ 對待估點 $x0$ 幾何位置是對稱的，因而它們之間的克里格權重係數也具有對稱性。

從聚效應降低克里格權重係數

在上圖中，即使區域化變量 $Z(x)$ 是各向同性結構的， $x1$ 與 $x5$ 對待估樣點 $x0$ 幾何對稱，也不能存在 $k1=k5$ ，因爲在樣點 $x5$ 附近還存在樣點 $x4,x6$ 和 $x7$ ，這三個樣點與 $x5$ 叢聚在一起，而x1是單獨的一個樣點，計算克里格權重係數的結果使 $k1>k5$ 。 $x4,x5$ 和 $x7$ 的叢聚作用降低了 $x5$ 對待估樣點 $x0$ 的影響。而 $x1$ 不存在叢聚效應。因此，在克里格估計中，不會由於一些樣點叢聚在一起而增大其權重係數，這也正是克里格法估計的優點

屏蔽效應

當塊金值很小或不存在時，已知樣點的克里格權重係數的大小受屏蔽效應影響，如圖，已知樣點 $x5$ 雖然與樣點 $x1$ 到待估樣點 $x0$ 的距離相等，但是 $x1$ 的克里格權重係數 $k1$ 確大於 $x5$ 的權重係數 $k5$ ，這主要是因爲樣點 $x5$ 受 $x4$ 的屏蔽效應影響

待估點 $x0$ 附近有 $x1,x2,……x12$ ，共12個已知樣點，由數據構形可知， $x1,x2,x3,x4$ 與 $x0$ 的幾何位置對稱且相等， $x5,x6…x12$ 與 $x0$ 的幾何位置也對稱且相等。內圈的每個已知樣點的克里格權重係數是 $(1-k)/4$ ，外圈的克里格權重係數是 $k/8$ ，總和爲1，因此，內圈的權重係數明顯大於外圈樣點的權重係數，這是由於內圈樣點屏蔽了外圈樣點的緣故

屏蔽效應還與塊金常數有很大關係，當塊金常數增大時，屏蔽效應減弱，當爲純塊金效應時，所有樣點之間相互獨立，協方差函數爲0，變異函數等於外延方差，即基臺值，則待估樣點 $x0$ 與周圍任何已知樣點的克里格權重係數均相同，此時屏蔽效應消失，任何一點上的克里格線性無偏最優估計量都是所有樣點的算術平均值。

5.2.6理論模型對克里格估值的影響

尺度對克里格估值的影響

令 $r_2(h)=0.5r_1(h)$

尺度變化後，屏蔽效應減弱，方差較小，精度提高，方差是一個相對誤差，並不會提高精度

左右分別爲 $r_1(h),r_2(h)$ ，可以看到待估點方差變得小一些，

變程對克里格估計的影響

原球狀模型變程爲40，如果變爲20，則新的球狀模型爲 $0.52(\frac{3}{2} \frac{h}{20}-\frac{1}{2}\frac{h^3}{20^3})$ ，則內圈樣點的克里格權重係數增大，而外圈樣點的克里格權重係數減小，增加了屏蔽效應，同時也增大了克里格估計方差，使估計的精度降低。變程較小，相當於穿過一個較小距離，就會超過基態值

塊金效應對克里格估值影響

由變異函數性質可知， $r(\infty)=C_0+C=C(0)$ ，基臺值相當樣點之間自相關消失，相互獨立時樣本方差。對於一個已抽取的空間樣本，其方差已確定，因此基臺值=常數，當 $C_0$ 增加時，供高要降低，當 $C_0$ 增加到與樣點獨立時的方差時， $C=0$ ，此時基臺值就是塊金常數 $C_0$ ，因此，塊金常數 $C_0$ 的增大，導致樣點之間的相關性降低而獨立性加大。

若把原來的球狀模型塊金值擴大一倍，即 $C_0=0.34$ ，基臺值不變

塊金值變大後，降低了內圈樣點的權重係數，增大了外圈樣點的權重係數，而克里格方差也增大了近一倍，這說明塊金效應增大可使屏蔽效應降低，顯然，當 $C_0=0.52$ 時，8個樣點的克里格權重係數均爲0.125，此時的塊金效應相當於純塊金效應

理論模型的種類對克里格估計的影響

換成線性有基態值模型對比

與球狀模型相比，線性有基臺值模型的克里格估計結果彙總，內圈的權重係數減小，而外圈的權重係數增大，這與屏蔽效應一致

鄰域內已知樣本數量對克里格估計的影響

克里格估計量是根據待估點的鄰域內已知樣點數據進行的，採用多少已知樣點數據估計才合適，沒有一個固定的標準。但從統計估計的角度看，估計方差隨着採樣的樣本數越多，而越小。當樣本擴大到一定數量後，估計方差基本保持在某一數值附近。因此，當估計方差開始保持平穩時的樣本數就可以作爲確定鄰域內已知樣點數的指標，在這個範圍內的樣點數據稱爲有效樣點數據

可以看出，當鄰域內有效樣本點的數量由4個增加到8個時，克里格估計方差基本保持不變，因此，在地統計學克里格估計中，一般多數採用4-8個領域內的有效數據，再擴大有效數據，會產生屏蔽效應，而且對克里格估計精度不起作用

討論題

在三維或時空領域，如何確定最近的n個鄰近點？時空領域：相隔100米1天近，還是相隔200米0天近？

其實就是找時空變異函數小的點，變異函數越小，時空距離就越近

5.2.7簡單克里格

如果我們知道區域隨機變量的平均值，那麼我們可以利用這種先驗知識通過簡單克里格法來提高預測的精度，這種克里格預測方法仍然是線性加和，但將隨機過程的平均值包括了進去，這種隨機過程必須是二階平穩的，預測公式爲
$Z_{s k}^{*}\left(x_{0}\right)=\sum_{i=1}^{n} \lambda_{i} z\left(x_{i}\right)+\left(1-\sum_{i=1}^{n} \lambda_{i}\right) \mu$

權重公式計算： $\sum_{i=1}^{n} \lambda_{i} \gamma\left(x_{i}, x_{j}\right)=\gamma\left(x_{0}, x_{j}\right)$

矩陣形式表示： $A\cdot \lambda=B$
$A=\left[\begin{array}{cccc} r\left(x_{1}, x_{1}\right) & r\left(x_{1}, x_{2}\right) & \dots & r\left(x_{1}, x_{n}\right) \\ r\left(x_{2}, x_{1}\right) & r\left(x_{2}, x_{2}\right) & \dots & r\left(x_{2}, x_{n}\right) \\ \dots & \dots & \dots & \dots \\ r\left(x_{n}, x_{1}\right) & r\left(x_{n}, x_{2}\right) & \dots & r\left(x_{n}, x_{n}\right) \end{array}\right] \quad B=\left[\begin{array}{c} r\left(x_{1}, x_{0}\right) \\ r\left(x_{2}, x_{0}\right) \\ \dots \\ r\left(x_{n}, x_{0}\right) \end{array}\right] \quad \lambda=\left[\begin{array}{c} \lambda_{1} \\ \lambda_{2} \\ \dots \\ \lambda_{n} \end{array}\right]$
預測方差爲： $\sigma_{SK}^2(x_0)=\sum_{i=1}^n\lambda_ir(x_i,x_0)$

5.2.8協同克里格

協同克里格是利用兩個變量之間的互相關性，用其中易於觀測的變量對另一變量進行局部估計的方法。協同克里格法比普通克里格法能明顯改進估計精度及採樣效率。但在實際應用中，協同克里格法要求有一個已知的相關函數，這就需要在很多地點同時採樣，測定二個函數間的相互關係。與相關函數一樣，這種相互關係也受樣本數目多少的影響

協同克里格法是建立在協同區域化變量理論基礎上的，通過建立交叉協方差函數和交叉變異函數模型，然後用協同克里格法對未抽樣點的變量進行估值

交叉協方差函數與變異函數

設點 $x-x+h$ 分別測兩個變量觀測值 $Z_k(x)、Z_{k'}(x)、Z_k(x+h)、Z_{k'}(x+h)$

交叉協方差函數：
$C_{K K}(h)=\frac{1}{N(h)} \sum_{i=1 \atop j=1}^{N(h)}\left[Z_{K^{*}}\left(x_{i}\right) Z_{K^{*}}\left(x_{i}+h\right)\right]\left[Z_{K}\left(x_{j}\right) Z_{K}\left(x_{i}+h\right)\right]-m_{K'} m_{K}$
$m_{K^{\prime}}=\frac{1}{N(h)} \sum_{i=1}^{N(h)}\left[Z_{K^{\prime}}\left(x_{i}\right)\right], m_{K}=\frac{1}{N(h)} \sum_{j=1}^{N(h)}\left[Z_{K}\left(x_{j}\right)\right]$

交叉變異函數:
$\gamma_{K^{\prime} K}(h)=\frac{1}{2 N(h)} \sum_{i=1 \atop j=1}^{N(h)}\left[Z_{K^{\prime}}\left(x_{i}\right)-Z_{K^{\prime}}\left(x_{i}+h\right)\right]\left[Z_{K}\left(x_{i}\right)-Z_{K}\left(x_{i}+h\right)\right]$
其實就是在普通克里格的情況下進行擴展，多了一個變量

後面更加詳細推導見ppt

5.2.9指示克里格

在有的情況下，我們需要知道某區域化變量 $Z(x)$ 在某地超過閾值 $z$ 的概率

指示碼：：僅有0和1兩個值，即可表示某種物質存在和不存在，也可表示連續變量是否大於某個閾值
$\omega(x)=\left\{\begin{array}{l} 1, z(x) \leq z_{c} \\ 0 \end{array}\right.$
通過這種轉換，某種程度上使預測結果更接近實際應用。如評價土壤重金屬污染問題，通過設定合理的污染濃度閾值 $z$ ，那麼就可以將一個連續的隨機變量 $Z(x)$ 轉化爲一個指示函數，對這個指示函數而言，1表示沒有受到污染，可以被接受，0表示受到污染，不能被接受，也可設置多個閾值。

通過轉換後，將轉換後的指示函數即離散點進行普通克里格插值，步驟相同，即可得到指示克里格結果，且範圍在0-1之間，表示一個區域被污染的概率。

5.2.10迴歸克里格(RK)

普通克里格和迴歸克里格區別:

普通克里格（OK）過分依賴樣點數據數量和質量，忽略了與被預測屬性相關的環境要素。而回歸克里格可把外部環境要素考慮進來，進而可提高預測精度。

首先對輔助變量和目標變量之間的迴歸關係進行探討，將空間上得趨勢項進行分離，對分離趨勢的殘差進行普通克里格插值，最後將回歸預測的趨勢項和殘差的普通克里格估值相加，從而得到目標變量的估測值。可用以下公式表達
$Z(x)=m(x)+e(x)\ e^*(x_i)=z(x_i)-m(x_i) \ Z(x_0)=m(x_0)+e(x_0)$
其中，m爲趨勢項，用迴歸方程擬合，e爲殘差項，用普通克里格進行預測

實例：
$\begin{array}{l} T N=2.115-2.056 \times N D V I-0.76 \times F M I \\ -0.132 \times S E I+0.0005 \times E l e v \end{array}$
將待預測位置上得上述環境因子值代入迴歸方程，即得到RK中的趨勢項。將各採樣點的TN觀測值減去對應的趨勢項得到殘差值，用OK方法對殘差進行預測；最後，各自的趨勢項數據與殘差預測數據相加，得到待預測位置的RK方法預測結果

思考題

迴歸克里格和協同克里格都是利用相關因子來預測，並可對精度提高有所貢獻，它們之間的區別在哪裏？什麼情況下用迴歸克里格，什麼情況下用協同克里格？

區別

OK方法的結果圖斑較爲平滑集中是因爲OK方法插值與採樣點的分佈規律相關，而RK明顯看出其空間分佈與地形地貌的變化趨勢類似是因爲RK考慮了各種環境因子的趨勢變化來得到趨勢項，因爲其殘差項是普通克里格插值得到的，但是殘差項對最後的插值結果影響比較小，起到主導作用的仍然是各種環境因子下綜合作用的趨勢項

適用情況

協調克里格的輔助數據是其他的樣點屬性，而回歸克里格輔助數據一般是面狀的

而回歸克里格是將樣點處的各種外部環境要素考慮進來，進而可提高預測精度
協同克里格法在理論上與普通克里格法本質相同，仍然是主要依賴採樣點數據空間插值，並且利用兩個變量之間的互相關性，用其中易於觀測的變量對另一變量進行局部估計的方法

5.3空間隨機模擬

5.3.1概述

然而大量研究發現, 克里格插值空間分佈圖具有一定的平滑效應, 會使空間數據變化劇烈區域的重要信息丟失, 且克里格插值存在着由於估計值與實際值之間的偏差導致的不確定性, 往往不能反映隱含在隨機場概率模型中的整體相關結構地統計學的空間隨機模擬法被提出以克服克里格法的缺陷

空間隨機模擬和克里格插值是地統計學的重要組成部分，空間隨機模擬與克里格估值力求減少估計誤差的主導思想相比，空間隨機模擬着重反映空間數據的波動性，處理與空間不確定性相關的變異問題

但與克里格方法相比，空間隨機模擬的應用還是較少，主要原因是計算方法複雜，計算時間較長

5.3.2空間隨機模擬分類

根據是否尊重原始實測樣點數據，分爲條件模擬和非條件模擬

條件模擬：在克里格插值法基礎上發展起來的一種隨機模擬方法，基本原理是根據區域化變量的分佈函數、協方差函數和變異函數，按照一定的算法產生大量不同“實現”，進而研究區域化變量的總體特徵。一般滿足下列三個條件：

1.服從一定的概率分佈，具有給定的數學期望和方差
2.與實測數據處所推斷的變異函數或協方差函數相同，即保持特定的空間相關結構
3.採樣處的模擬值等於該點的實測值只滿足前兩個條件的隨機模擬叫非條件模擬
華

非條件模擬：轉換帶法、光譜法、LU矩陣分解法

條件模擬：轉換帶法、LU矩陣分解法（結合原始數據向量）、非條件模擬和克里格方法結合、序貫模擬方法、模擬退火法

5.3.4序貫高斯模擬

序貫高斯模擬是貝葉斯理論的一個應用，此方法根據現有數據計算待估模擬點值的條件概率分佈，從該分佈中隨機取一值作爲模擬現實。每得出一個模擬值，就把它連同原始數據、此前得到的模擬數據一起作爲條件數據，進入到下一點的模擬。

序貫高斯模擬是條件高斯隨機模擬最常用的方法。

步驟

1.確定單變量的累積分佈函數 $f(x_i;z_i)$ ，它代表了整個研究區內包含全部數據樣本量的分佈特徵。其中 $x_i$ 可以是任意維度，如果是區域化變量就是兩維

2.將原始數據 $Z$ 進行標準正態分佈變換

3.在某個節點進行簡單克里格估值(或者說是在某個區域下的點，是隨機選取的)
$Z_{s k}^{*}\left(x_{0}\right)=\sum_{i=1}^{n} \lambda_{i} z\left(x_{i}\right)+\left(1-\sum_{i=1}^{n} \lambda_{i}\right) \mu$
並計算對應方差：
$\sigma_{S K}^{2}\left(x_{0}\right)=\sum_{i=1}^{n} \lambda_{i} r\left(x_{i}, x_{0}\right)$
4.根據克里格方差，產生一隨機殘差函數，該函數滿足均值爲0，方差等於克里格方差的正態分佈。

5.將產生的殘差 $R(x_0)$ 加入到克里格估值中，就是該節點的模擬值 $Z_{SGS}=Z_{SK}^*(x_0)+R(x_0)$ 另外，也可以直接從滿足均值爲 $Z_{SGS}(x_0)$ ，方差爲 $\sigma^2_{SK}(x_0)$ 的正態分佈中產生模擬值

6.將該節點產生的模擬值加入現有數據，一起作爲以後模擬的條件數據

7.採用隨機順序，逐一訪問所有需要模擬的節點，重複上述計算，直到所有的點都完成模擬

8.最後，將模擬結果進行逆高斯變換還原爲原始變量

9.利用不同隨機“種子”數，產生不同的模擬實現。同時，不同的“種子”會產生不同的隨機數序列，因此，對於各節點就有不同的隨機路徑和殘差。但是，每個實現的出現機率都是均等的。

幾個要點

訪問路徑：可隨機，也可規則，但規則設計會使結果更趨理想
模擬前，數據要符合正態分佈
簡單克里格（SK）：如不符合簡單克里格條件（均值已知），則可分區計算

實例

姚榮江等. 海塗圍墾區土壤鹽分空間變異性隨機模擬與不確定性評價[J]. 中國生態農業學報2011，19（3）：485-490

$[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-2l1qTW8s-1590306111323)(C:\Users\asus\AppData\Roaming\Typora\typora-user-images\image-20200519112702752.png)]$

結論:由普通克里格法得到的土壤鹽分空間分佈整體比較連續,具有明顯的平滑效應,減小了數據間的空間差異性,改變了數據的空間結構;序貫高斯模擬結果整體分佈相對離散,突出了原始數據分佈的波動性。對非鹽化土、輕度鹽化土、中度鹽化土和重度鹽化土的空間不確定性進行的序貫指示模擬結果顯示,圍墾後研究區耕層土壤鹽漬化的發生概率已顯著降低。輕度鹽化土的高概率區是改良利用的主要區域,宜採用農業生物改良措施,對中度鹽化土高概率區應通過完善田間灌排設施以加強改良治理,客土法是重度鹽化土高概率區較爲高效的改良治理途徑

5.3.5結論

克里格追求的是最高的估值精度和最小的估值方差，結果具有平滑效應。而隨機模擬適合於定量刻畫某一屬性的非均質和不確定性。
克里格估值只有一個結果，而隨機模擬可產生多個結果，可以用來研究空間不確定性問題。
如何得到空間不確定性結果？請大家思考

隨機模擬一般模擬500-1000次，那麼在同一個位置上就有500-1000次結果，將預先劃分好的區間範圍例如 $[0,10],[10,20],[20,30]...,[90,100]$ 統計500-1000次的模擬值落入這些區間的概率，每一個位置都有這樣的統計頻次模擬圖。

地學計算方法/地統計學(5第五章空間插值與克里格法）

5第五章空間插值與克里格法