地統計之數據分佈探索

昨天講了對數據預處理的一個最簡單的方法,利用數據分級進行異常值查詢,這只是數據探索的第一步,而實際地統計分析前期數據的探索光去除異常值遠遠不夠,還需要對數據的分佈進行檢查,探索全局異常值和局部異常值,瞭解全局趨勢和局部變化,進而檢查空間自相關(這一步對於克里金插值方法的選擇至關重要)。今天我們的專題就是對定量數據分佈探索。

Tips:不是所有的插值方法都要求數據服從正態分佈,但以下方法要求數據必須服從正態分佈,普通克里金、簡單克里金和泛克里金法創建分位數圖和概率圖,如果數據本身不是正態分佈,想要使用上述方法,必須通過某種變換使數據服從正態分佈。直方圖和正態QQ圖可幫助檢查數據是否服從正態變換。

步驟:地統計分析工具條→探索數據→直方圖或正態圖
在這裏插入圖片描述
由上圖可以看出直方圖由兩部分內容組成,頻率分佈和彙總統計數據。頻率分佈爲條形圖顯示的內容,用來顯示觀察值位於特定區間或組之內的頻率。彙總統計數據的內容:平均值:數據的算數平均值;標準差:用來表徵離散度,值越小,說明數據聚類相對於均值越緊密;偏度:用來表徵分佈對稱度的測量值。對於對稱的分佈,偏度係數爲零。如果分佈具有較長的大值右尾部,則爲正偏分佈;如果分佈具有較長的小值左尾部,則爲負偏分佈。對於正偏分佈,平均值大於中間值;對負偏分佈,平均值小於中間值。下圖顯示了一個正偏分佈;峯度:用於表徵分佈尾部的大小,正態分佈的峯度等於三。具有較厚尾部的分佈被稱爲高峯態,其峯度大於三。具有較薄尾部的分佈被稱爲低峯態,其峯度值小於三;1/4分位數:升序排列,位於中位數之下,第一分位數之上;中位數:與累積比例0.5對應;3/4分位數:升序排列,位於中位數之上。

如果數據不服從正態分佈,可通過變換方式對數據進行變換。

QQ圖檢查數據分佈
在這裏插入圖片描述
正態 QQ 圖上的點可用來指示單變量數據分佈的正態性,如果是正態分佈,點將落在 45 度參考線上,如果數據不是正態分佈,點將會偏離參考線。

想要了解更多知識,獲得乾貨,關注微信公衆號:GIS點滴

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章