RFsp — Random Forest for spatial data (R tutorial) (翻譯)

原文 :https://github.com/thengl/GeoMLA

摘要:本教程介紹瞭如何使用隨機森林生成空間和時空預測(即使用隨機森林從點觀測生成地圖)。空間自相關,特別是在交叉驗證殘差中仍然存在時,表明預測可能存在偏差,這是次優的。爲了解釋這一點,我們使用隨機森林(如ranger包中實現的那樣)結合到抽樣位置的地理距離來擬合模型和預測值。我們描述八個典型情況下感興趣的空間預測的應用:

(1)二維連續變量的預測沒有,

(2)預測二維變量,

(3)二項預測變量,

(4)預測分類變量,

(5)預測變量的極值,

(6)加權迴歸,

(7)預測多變量問題,

(8)預測的時空變量。

結果表明,RFsp與基於模型的地質統計學結果具有可比性。相對於基於模型的地理統計,RFsp的優勢在於,RFsp需要更少的統計假設,並且更容易自動化(並通過並行化進行擴展)。另一方面,RFsp的計算強度會隨着訓練點和協變量的增加而增大。RFsp仍然是一種實驗方法,不推薦使用大數據集(>>1000點)。

This is a supplementary material prepared for the need of a scientific article: Hengl, T., Nussbaum, M., Wright, M. and Heuvelink, G.B.M., 2018. "Random Forest as a Generic Framework for Predictive Modeling of Spatial and Spatio-temporal Variables", PeerJ (accepted for publication). To download all data sets and more detail code examples please refer to https://github.com/thengl/GeoMLA/tree/master/RF_vs_kriging

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章