地學計算方法/地統計學(第三章區域化變量理論)

3第三章 區域化變量理論

3.1區域化變量的概念與性質

地統計學是以區域化變量理論爲基礎的
誰能說說與隨便變量相比,區域化變量的特色?
-與位置相關
-既有隨機性又有結構性
-不能重複取值
-樣本之間存在空間相關性
區域化變量是定義在隨機場的概念之上的

3.1.1隨機場

隨機變量:隨機變量表示隨機試驗各種結果的實值單值變量(Z),且對於試驗中的任何實值都有確定的概率,隨機變量和對隨機變量的觀測可以從總體和抽樣的角度來理解。隨機變量(Z)每次的觀測結果是一個確定的數值(z),就相當於總體中一個樣本的觀測值,數值z稱爲隨機變量的一個實現

隨機函數:隨機實驗每個結果都有一函數Z(x1,x2,...,xn,w)(x1,x2,...Xn)Z(x_1,x_2,...,x_n,w) (x_1,x_2,...\in X_n),當各自變量均取任一固定值時,函數ZZ爲一隨機變量,則稱Z爲定義在X1,X2,..Xn{X_1, X_2, …..X_n}上的一個隨機函數,隨機函數Z(x1,x2,...,xn,w)Z(x_1,x_2,...,x_n,w)可理解爲具有nn個參數的隨機變量族或式所有實Z(x1,x2,...,xn,w)Z(x_1,x_2,...,x_n,w)的集合

隨機過程:當隨機函數中只有一個自變量x1x_1,且x1=tx_1=t(一般表示時間)時,稱爲隨機過程,記爲Z(t,ω)Z(t,ω)Z(t)Z(t). 有兩種理解
隨機過程是所有隨機實現的集合
隨機過程是依賴於一個參數t的一族隨機變量

你能給出一個現實生活中隨機過程的例子嗎?

商品價格的漲跌

隨機場

•當隨機函數依賴於多個(兩個及兩個以上)自變量時,稱爲隨機場。隨機場也可從兩方面來理解

•隨機場是其所有實現的集合

•隨機場是依賴於空間點的一族隨機變量,當參數固定時,就是隨機變量

小結:

隨機函數是具有n個參數的隨機變量族
當隨機函數中的自變量取一固定值時,隨機函數爲一隨機變量
image-20200517113805829

3.1.2區域化變量

當一個變量呈空間分佈時,稱之爲區域化,這種變量常常反映某種空間現象的特徵,用區域化變量描述的現象稱之爲區域化現象

假設在研究區D內進行機械採樣採集了土壤的一種屬性,樣點個數爲nnn*n,其觀測值爲:

z(xj,yj)i=1,2,...,n,j=1,2,...nz(x_j,y_j) i=1,2,...,n,j=1,2,...n

則區域化變量定義爲:數據集z(xj,yj)z(x_j,y_j)是來自於隨機函數Z(x,y)(x,y)DZ(x,y) (x,y)∈D,的一個特定實現,即區域化變量z(x,y)z(x,y)的樣品實現值集合

區域化變量性質:

  • 隨機性:ž局部的、隨機的、異常的性質
  • 結構性:變量在點XX與點X+hX+hhh爲距離)處的數值Z(x)Z(x)Z(x+h)Z(x+h)具有某種程度的自相關。這種自相關依賴於兩點間的距離hh及變量特徵
  • 空間侷限性:被限制在一定的空間範圍內,在該範圍之外,變量的屬性爲0
  • 不同程度的連續性:用相鄰樣點之間的變異來度量,如土壤厚度連續性強,而土壤有效氮可能在兩個非常靠近的樣點上,也可能有很大差異(塊金效應)
  • ž不同類型的各向異性:若在各個方向上的性質變化相同,稱爲各向同性,反之,稱爲各向異性。

兩兩間隔相同的三個點,其中一組點之間的差異會比另一組點差異大

平原地區的農田可以看出是各項同性的

3.2協方差函數與變異函數

3.2.1協方差函數

Z(x)Z(x)爲區域化變量,xx爲空間點的位置,hh爲空間兩點的距離,則協方差函數C(x,x+h)C(x,x+h)
Cov[Z(x),Z(x+h)]=E({Z(x)E[Z(x)]}{Z(x+h)E[Z(x+h)]}) \operatorname{Cov}[Z(x), Z(x+h)]=E(\{Z(x)-E[Z(x)]\}\{Z(x+h)-E[Z(x+h)]\})
h=0h=0,協方差函數C(x,x+h)=var[Z(x)]C(x,x+h)=var[Z(x)]

協方差函數計算方法:

Z(x)Z(x)爲區域化隨機變量,並滿足二階平穩條件,hh爲兩樣本點空間分隔距離(步長),Z(xi)Z(x_i)Z(xi+h)Z(x_i+h)分別是Z(x)Z(x)在空間位置xix_ixi+hx_i+h上的觀測值,則協方差函數的計算公式爲
C(h)=1N(h)i=1N(h)[Z(xi)Z(xi)][Z(xi+h)Z(xi+h)] C^{*}(h)=\frac{1}{N(h)} \sum_{i=1}^{N(h)}\left[Z\left(x_{i}\right)-\overline{Z\left(x_{i}\right)}\right]\left[Z\left(x_{i}+h\right)-\overline{Z\left(x_{i}+h\right)}\right]
Z(xi)\overline {Z\left(x_{i}\right)}Z(xi+h)\overline {Z\left(x_{i}+h\right)} 分別爲Z(xi)Z(x_i)Z(xi+h)Z(x_i+h)的算術平均值,N(h)N(h)是分隔向量hh時樣本的對數

image-20200517130011892

爲什麼要計算這麼複雜的協方差?

協方差函數用於分析空間自相關性變化

3.2.2變異函數

變異函數要會計算,默寫

一般成爲試驗變異函數,有樣點計算

是隨着一個遞增趨勢,隨着變異性增加,距離是增大的

一維條件下,當空間點xx在一維xx軸上變化時,區域化變量**Z(x)Z(x)在點xxx+hx+h處的值Z(x)Z(x)Z(x+h)Z(x+h)差的方差一半定義爲區域化變量Z(x)在x軸方向上的變異函數**。
通常區域化變量Z(x)Z(x)所描述的現象是二維和三維的,則變異函數可定義爲在任一方向αα,相距h|h|的兩個區域化變量值Z(x)Z(x)Z(x+h)Z(x+h)的增量的方差
2γ(x,h)=Var[Z(x)Z(x+h)]=E[(Z(x)Z(x+h))2](E[(Z(x)Z(x+h))])2 2\gamma(x,h)=Var[Z(x)-Z(x+h)] =E[(Z(x)-Z(x+h))^2]-(E[(Z(x)-Z(x+h))])^2
其中γ(x,h)γ(x,h)稱爲半變異函數,但有時爲方便也稱變異函數
變異函數計算公式
γ(h)=12N(h)i=1n[Z(xi)Z(xi+h)]2 \gamma(h)=\frac{1}{2N(h)}\sum_{i=1}^n[Z(x_i)-Z(x_i+h)]^2
其中hh爲距離(滯後距)
N(h)N(h)爲樣點中符合該距離hh的點對數量
xix_ixi+hx_i+h爲各點對位置

image-20200517132728681

ž變程 (Range):通常變異函數是一個單調遞增函數,當步長hh超過某一數值(a,a>0)(a, a>0)後,變異函數的值不再繼續單調地增大,而往往穩定在一個極限值附近,這種現象稱爲“躍遷現象”,a稱爲變程。

ž基臺值 (Sill): 當變異函數隨步長增加到一個相對穩定的水平所對應的變異函數的值。

ž塊金常數(Nugget): 對於變異函數γ(h)γ(h),當h0h\to0時,limγ(h)=C0(C0>0)lim γ(h)=C_0 (C_0>0), 即爲常數, 這種現象稱爲塊金效應,C0C_0 稱爲塊金常數。

變異函數性質

  • γ(h)=0\gamma(h)=0變異函數在h=0h=0時爲0
  • γ(h)=γ(h)\gamma(h)=\gamma(-h),偶函數
  • γ(h)0\gamma(h)\ge0恆大於或等於0
  • h|h|\to \infty時,γ(h)C(0)\gamma(h)\to C(0),當空間上樣點間距離無限大時,變異函數接近先驗方差
  • [γ(h)][-γ(h)]必須是一個條件非負定函數

變異函數功能:

  • 變異函數通過變程反映變量的影響範圍

    1. 通常空間相關性隨兩點距離的增大而減弱,當步長(h)(h)大於變程(a)(a)時,協方差C(h)=0C(h)=0,即Z(x)Z(x)Z(x+h)Z(x+h)間不存在空間相關性。
    2. 基臺值的大小反映了區域化變量變化幅度的大小,即反映區域化變量在研究範圍內變異的強度
  • 不同方向上的變異函數圖可以反映區域化變量的各向異性,如果在各個方向上區域化變量的變異性相同或相近,則稱區域化變量是各向同性,反之稱爲各向異性。各向同性是相對的,各向異性是絕對的。

  • 塊金常數C0C_0的大小可反映區域化變量的隨機性大小。塊金常數主要有兩種來源:微觀結構,即區域化變量在小於抽樣尺度h時所具有的變異性;採樣、測量和分析等誤差

  • 變異函數在原點處的性狀可以反映區域化變量的空間連續性
    image-20200517132728681

隨機樣點的試驗半方差

在很多情況下,樣點並不是規則採集(機械採樣)的,而是呈現不規則分佈,這時,如何計算試驗半方差?
一般地,在實際計算時,假設步長爲laglag,當前滯後級別爲nn(nn爲正整數),則h=nlagh=n*lag,應該這樣處理:

計算步驟
1.研究區所有點,找到點對(Pi,Pj)(P_i,P_j),其符合條件:(n1)lag<dis(Pi,Pj)<=nlag(n-1)*lag<dis (P_i,P_j)<=n*lag,它們之間的距離記爲DISiDIS_i
2.計算[z(pi)z(pj)]2[z(p_i)-z(p_j)]^2,記爲SiS_i.
3.設找到N(h)N(h)個這樣的點對,計算平均距離havg=1N(h)i=1N(h)DISih_{avg}=\frac{1}{N(h)}\sum_{i=1}^{N(h)}DIS_i
4.計算r(havg)=12N(h)i=1N(h)Sir^*(h_{avg})=\frac{1}{2N(h)}\sum_{i=1}^{N(h)}S_inn滯後級別上的經驗半方差值。
5.將各個級別的(havgr(havg))(h_{avg},r*_{(havg)}),繪製在圖上,形成經驗半方差圖

變異函數計算(三維)

三維區域化變量的計算和二維區域化變量的計算相似

  • 對於等間距規則網格採樣數據,在找數據對時可將三維採樣數據看做若干二維採樣數據分別進行數據對查找
  • 對於不規則網格採樣數據,則需在三維空間進行分組

思考題

思考1:爲什麼變異函數散點圖一般在短距離範圍內呈遞增狀態,而達到一定距離(變程)後呈上下波動狀態?

超過變程之後,任意兩隨機樣點將不再具有空間相關性

思考2:變程,基臺值和塊金值三個參數的大小各反映了地理屬性空間相關性的什麼特徵?

變程是變量影響範圍的大小,基臺值反映的是變異幅度,塊金值反映區域化變量的隨機性大小,在最小採樣尺度下的距離以及隨機誤差

思考3:對於時空樣點數據,如何計算時空經驗變異函數?如何理解下圖中的時空變異函數?

image-20200517143346497

定義時空變量Z(x)=Z(s,t)sS,tTZ(x)={Z(s,t)|s\in S,t\in T}其中SR2,TRS\in R^2,T\in RSS表示空間域,TT表示時間域

在本徵假設條件下,時空變異函數如下:
γ(hS,hT)=12N(hS,hT)i=1N(hS,hT)[z(si,ti)z(si,+hS,ti+hT)]2 \gamma\left(h_{S}, h_{T}\right)=\frac{1}{2 N\left(h_{S}, h_{T}\right)} \sum_{i=1}^{N\left(h_{S}, h_{T}\right)}\left[z\left(s_{i}, t_{i}\right)-z\left(s_{i},+h_{S}, t_{i}+h_{T}\right)\right]^{2}

式中,hSh_ShTh_T分佈式空間和時間間隔,N(hS,hT)N(h_S,h_T)爲符合所定義間隔點對數

時空變異函數模型

相比較於空間理論變異函數模型,時空變量由於在時間和空間上的度量以及變異情況的不同,使得所需構建的模型較爲複雜。通常將時空理論變異模型分爲分離型模型和非分離型模型。其中,時空分離模型將時間和空間上的變異分別用一個模型擬合(如球狀模型、高斯模型),再將其用乘積、線性組合、乘積和等方式組合起來;而時空非分離模型將時空變異統一考慮,一般基於數學模型產生,如隨機微分方程、極限理論、譜密度函數等

時空經驗半方差計算

舉例

設置空間計算步長爲5 km,時間計算步長爲1d,最大空間計算距離爲100km,最大時間計算距離爲14 d,按照上式計算時空經驗半方差函數(如圖2中黑色“火”型離散點所示)。在空間上,經驗半方差函數值隨着空間距離增加而增加;在時間上,經驗半方差函數值隨着時間距離增加而增加,直到3 d以後,經驗半方差函數值趨於平穩。

理解時空變異函數:
經驗時空變異函數值越小說明兩點之間的時空變異性就越小,將時間固定不變,則其就是在二維空間域距離上的變異函數,將空間間距視爲不變,則就是在時間維度上的變異,從時間跨度上來看,在時間維度上的變異往往比距離上的變異要大

更加詳細內容見如下文獻

梅楊,楊勇,李浩.時空理論變異函數模型及其精度影響[J].測繪科學,2017,42(06):1-5+35.

3.3地統計學理論假設

因爲區域化變量在同一地點不能重複觀測,因此地統計學提出了平穩假設內蘊假設

3.3.1平穩假設

  • 平穩假設:表示當將既定的nn個點的點集從研究區域某一處移向另一處時,隨機函數的性質保持不變,也稱爲平移不變性。

Fx1,...,xn(z1,...,zn)=Fx1+h,...,xn+h(z1,...,zn) F_{x_1,...,x_n}(z_1,...,z_n)=F_{x_1+h,...,x_n+h}(z_1,...,z_n)

隨機函數分佈的規律性不因位移而改變,是嚴格平穩的,具有平穩性

舉例:

image-20200517131013894

上圖中上面一個符合平穩假設

  • 二階平穩假設

二階平穩性假設(弱平穩性假設):隨機函數的均值爲一常數,且任何兩個隨機變量之間的協方差依賴於它們之間的距離和方向,而不是它們的確切位置

二階平穩假設需滿足兩個條件

  • 在整個研究區內,區域化變量的數學期望對任意x存在,且等於常數

E[Z(x)]=m,xD E[Z(x)]=m,x\in D

  • 在整個研究區內,區域化變量的協方差函數對任意x和h存在,且平穩,即:

Cov[Z(x),Z(x+h)]=E[{Z(x)E[Z(x)]}{Z(x+h)E[Z(x)]}]=E[{Z(x)m}{Z(x+h)m}]=E[Z(x)Z(x+h)m2]=C(h) \begin{array}{l} \operatorname{Cov}[Z(x), Z(x+h)]=E[\{Z(x)-E[Z(x)]\}\{Z(x+h)-E[Z(x)]\}] \\ =E[\{Z(x)-m\}\{Z(x+h)-m\}] \\ =E\left[Z(x) Z(x+h)-m^{2}\right]=C(h) \end{array}

在二階平穩條件下,協方差函數的平穩會對變異函數產生什麼影響呢?

  • 協方差函數平穩意味着方差函數和變異函數的平穩。變異函數平穩,意味着變異函數只與步長(h)相關,而與具體位置x無關。
  • 在二階平穩假設條件下,協方差與變異函數有如下關係:γ(h)=C(0)C(h)γ(h)=C(0)-C(h)
  • ž協方差函數和變異函數都表示相距爲hh的兩個變量Z(x)Z(x)Z(x+h)Z(x+h)之間的自相關性

3.3.2內蘊(本徵)假設

當區域化變量Z(x)Z(x)的增量[Z(x)Z(x+h)][Z(x)-Z(x+h)]滿足下列兩個條件時,稱爲滿足內蘊(本徵)假設:

  • 在整個研究區內,區域化變量Z(x)Z(x)的增量[Z(x)Z(x+h)][Z(x)-Z(x+h)]的數學期望爲0,即

E[Z(x)Z(x+h)]=0 E[Z(x)-Z(x+h)]=0

E(x)E(x)存在,條件等價於E[Z(x)]=E[Z(x+h)]=m()E[Z(x)]=E[Z(x+h)]=m(常數)

  • 在整個研究區內,區域化變量Z(x)Z(x)的增量[Z(x)Z(x+h)][Z(x)-Z(x+h)]的方差函數存在且平穩(即只依賴於位移hh, 而與xx無關)

var[Z(x)Z(x+h)]=2γ(h) var[Z(x)-Z(x+h)]=2\gamma(h)

3.3.3準二階平穩和準內蘊假設

在實際應用中,區域化變量Z(x)Z(x)往往在整個研究區域內並不滿足二階平穩(或內蘊)假設,但有限大小的領域內滿足二階平穩(或內蘊)假設,則稱區域化變量Z(x)Z(x)是準二階平穩(或準內蘊)的

3.3.4小結

就嚴格性而言:

平穩性假設>二階平穩性假設>本徵假設
本徵假設是地統計學中對隨機函數的基本假設

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章