GIS可視化—熱力圖製作與熱點分析(二)

  本博客知識來源:城市數據派公衆號,WeChat ID:udparty。講師:張海平老師(高級城市數據分析師),本文對講解PPT中的內容進行總結概括,並方便自己以及他人更加直觀的瞭解與學習熱力圖方面的知識,未經博主允許請勿轉載,如有侵權請聯繫博主。

相關學習資源(持續更新)

發現要素的關鍵特徵和分佈模式

1.從場所到要素的地理對象表達

場所和地圖上的點:
  場所承載了地表的事物和事件,在地圖上,大到一個城市,小到一個餐館、一個賓館酒店、一個ATM機,甚至一個垃圾桶,這些地理實體對象都可以通過點來表示;此外,某個犯罪事件或交通事故事件等,也都可以在地圖上表示爲一個點。
點具有地理位置:
  點代表着場所或者事件,則必定存在具體的地理位置,地理位置必然存在着差異。這種不同區域的地理位置點的差異性是空間格局存在的必然條件。
點具有空間關係和模式:
  地域具有差異性,地理學第一定律的存在,才使空間分析具有實際意義。識別地理模式對於理解地理現象是非常重要的。

2.簡單的度量地理分佈方法

要素的分佈:
  通過地圖上的點表示的場所和事件,如何描述它們的空間分佈特徵。在ArcGIS中,可以通過簡單的基於距離的分佈度量模型進行分析彙總。例如,點集的中心位置、中心要素、分佈方向、聚散程度等。



標準差橢圓:
  通過地圖上的點表示的場所和事件,如何描述它們的空間分佈特徵。在ArcGIS中,可以通過簡單的基於距離的分佈度量模型進行分析彙總。例如,點集的中心位置、中心要素、分佈方向、聚散程度等。



3.熱點分析理論基礎

統計學與數學:
  統計學以數學中的概率論爲基礎,自己編一把尺,然後丈量世界,世界他永遠看不到盡頭,瞭解的永遠只是世界的鏡像
  數學是科學的語言,是一門基礎學科。其中純數學研究數量、結構、變化等,以集合論爲基礎,更多側重於邏輯演化。有點“自編自導自演”,世界就在自己手中又何必去追尋世界
空間統計與傳統統計學:
  空間統計和非空間統計(傳統統計方法)在概念和目標方面可能存在某些相似性,但空間統計具有其固有的獨特性,因爲它們是專門爲處理地理數據而開發的。與傳統的非空間統計分析方法不同,空間統計方法是將地理空間(鄰域、區域、連通性和/或其他空間關係)直接融入到數學邏輯中。
空間統計與GIS:
  GIS是地理的語言,計量地理學支撐了地理學作爲一門自然科學而存在。GIS的發展,使計量地理模型逐步融入其中,變成了GIS中的各類分析模型和工具。
零假設與隨機分佈:
  大多數統計檢驗在開始時都首先確定一個零假設。在空間統計分析中,零假設就是假定某種對象在空間上的分佈是隨機的。通常通過Z值和P值來進行度量某種對象的空間分佈是隨機過程還是非隨機過程(離散或聚集)。 我們通常希望某種對象的空間模式是聚集的或離散的,而不是隨機過程,因此,我們總是希望推翻零假設。



4.空間分佈模式理論與應用

全局空間分佈模式:
  通常情況下,通過地圖,我們可以直接通過可視化判斷某種地理對象的空間分佈模式。然而,如果是同一組對象在不同時間存在細微變化的分佈模式,或者具有負責的難以識別的分佈模式,就必須通過定量的方法進行分析和描述。
  另一方面,如下圖所示,如果從全局看,顯示是聚類的,但如果僅僅將西北角作爲研究單元,可能就不是聚類模式了。因此,探索某種對象的空間模式,採用不同的研究單元,得出的結果也可能完全不同。
ArcGIS中的全局空間分佈模式:
 平均最鄰近(Average Nearest Neighbor )
 空間自相關(Global Moran’s I)
 增量空間最相關(Incremental Spatial Autocorrelation )
 高低聚類(Getis-Ord General G)
 多距離空間聚類分析(Ripley’s K Function)

  • 平均最鄰近( Average Nearest Neighbor ):
      根據每個要素與其最近鄰要素之間的平均距離計算其最近鄰指數。其中,臨近指數小於1,則表示的模式爲聚類, 大於1則表示的模式爲趨於離散。



  • 空間自相關( Average Nearest Neighbor ):
    根據要素位置和屬性值使用 Global Moran’s I 統計量測量空間自相關性。



    1. 當p值不具有統計學上的顯著性 :不能拒絕零假設。要素值的空間分佈很有可能是隨機空間過程的結果。觀測到的要素值空間模式可能只是完全空間隨機性 (CSR) 的衆多可能結果之一。
    2. 當p值具有統計學上的顯著性 :其 Z值大於0 可以拒絕零假設。如果基礎空間過程是隨機的,則數據集中高值和/或低值的空間分佈在空間上聚類的程度要高於預期。
    3. 當p值具有統計學上的顯著性,且 Z值小於0 :可以拒絕零假設。如果基礎空間過程是隨機的,則數據集中高值和低值的空間分佈在空間上離散的程度要高於預期。離散空間模式通常會反映某種類型的競爭過程 - 具有高值的要素排斥具有高值的其他要素;類似地,具有低值的要素排斥具有低值的其他要素。

        空間自相關不僅可以分析點,還可以分析線和麪。線和麪取要素的中心點進行分析。 另外,以人口爲例,採用行政區劃面和行政區劃點分析的結果不一致。如下所示:



  • 高低值聚類( Getis-Ord General G):
    使用 Getis-Ord General G 統計可度量高值或低值的聚類程度。



    1. 當p值不具有統計學上的顯著性 :不能拒絕零假設。要素值的空間分佈很有可能是隨機空間過程的結果。觀測到的要素值空間模式可能只是完全空間隨機性 (CSR) 的衆多可能結果之一。
    2. 當p值具有統計學上的顯著性 :可以拒絕零假設。如果基礎空間過程是完全隨機的,則數據集中高值的空間分佈與預期的空間分佈相比在空間上的聚類程度更高。
    3. 當p值具有統計學上的顯著性,且 Z值小於0 :可以拒絕零假設。如果基礎空間過程是完全隨機的,則數據集中低值的空間分佈與預期的空間分佈相比在空間上的聚類程度更高。

5.空間分佈模式理論與應用

要素的空間分佈特徵:
1. 總體特徵的分析屬於二階效應,幾乎都是基於離散點之間的距離實現。
2. 總體特徵的分析將傳統的平均值,中位數,標準差等推廣到地理空間中的要素的分佈。

要素的空間分佈全局模式:
1. ArcGIS提供的要素空間模式分析模型,可以對點、線、面和多點要素進行分析。
2. 此類模型僅僅描述空間要素的全局模式而非局部模式。
3. 有些全局模式分析模型僅僅基於要素的空間位置進行分析,如平均最鄰近分析;有些全局模式分析模型則可以基於要素的某個屬性值進行分析,如空間自相關和高低值聚類分析。

熱力圖與熱點圖

1.力圖和熱點分析的區別

熱力圖:
  採用樣方統計或者核 密度的方式,對點數 據的全局空間模式進 行分析和表達。是衆多聚類方法中的一類,這類分析方法通常通過觀察進行模式識別,不能算作是真正意義上的定量分析。
熱點分析:
  儘管可以通過對要素製圖來了解它們的總體模式及其關聯值,但通過計算統計數據能夠將模式量化。對於一些要素,在觀察這些要素的過程中,高值要素往往容易引起注意,但可能不是具有顯著統計學意義的熱點。要成爲具有顯著統計需意義的熱點,要素應具有高值,且被其他同樣具有高值的要素所包圍通過執行聚類分析來識別具有統計顯著性的熱點、冷點和空間異常值的位置。查看鄰近要素環境中的每一個要素。這種定量模式的發現和可視化,稱爲熱點分析。




  如上圖所示將該地區進行熱力圖分析和熱點分析的結果爲:


2.聚類分佈製圖的分析方法

熱點分析( Average Nearest Neighbor ):
  給定一組加權要素,使用 Getis-Ord Gi* 統計識別具有統計顯著性的熱點和冷點。
  局部空間自相關不同於全局空間自相關。它通過計算局部某個要素及其周圍要素值的總和與所有要素值的總和進行比較(我們的假設是所有要素是隨機分佈的,因此任何局部區域的要素值總和值的分佈模式和總體的分佈模式是一致的), 當局部實際值和基於全局的預測值不一致時,則拒絕原假設。即具有統計學上的顯著性。通過Z得分來描述是熱點分佈還是冷點分佈。




  注:熱點分析一般不會直接通過點數據進行分析,如果分析所用的數據爲點,則可以 通過收集事件、構建漁網或者通過行政區劃等面要素,空間連接屬性後進行分析和製圖。

分組分析( Average Nearest Neighbor ):
  根據要素屬性和可選的空間/時態約束對要素進行分組。
  “人以羣分,物以類聚”,我們在認識世界上的任何對象時,都會對其進行分類。對於一個明確的分類標準,可以很容易對目標對象進行分類。如對於一個班級的學生,按照性別可以分爲男生和女生。但更多的時候,對某個羣體的分類並沒有一個明確的標準,需要依據一個或多個屬性進行自動分類。我們把這類問題叫NP難題。採用分組 分析,可以對數據進行探索性分類。







  注:在對目標對象進行分類之前,首先需要對數據進行探索性分析,瞭解數據的特點, 只有這樣,才能更加科學的使用此工具,從而得好的分析結果。

聚類與異常值分析( Anselin Local Moran’s I ):
  給定一組加權要素,使用 Anselin Local Moran’s I 統計量來識別具有統計顯著性的熱點、冷點和空間異常值。



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章