提升樹與梯度提升樹 Boosting Tree & Gradient Boosting Decision Tree(GBDT)

提升樹(Boosting Tree)
以決策樹爲基函數的提升方法稱爲提升樹。提升樹對分類問題，提升樹是二叉分類樹，對迴歸問題提升樹是二叉迴歸樹。

提升樹方法實際採用的是加法模型(即基函數的線性組合)與前向分步算法，因此提升樹模型可以表示爲決策樹的加法模型：

{\hat{y}}_{i} = f_{K} (x) = \sum_{k = 1}^{K} T (x; θ_{k}) = \sum_{k = 1}^{K} f_{k} (x; θ_{k})

其中

T (x; θ_{k})

表示某一顆決策樹，

θ_{k}

是決策樹的參數，

K

爲決策樹的個數

提升樹算法過程：
假設有數據集 $T = {(x 1, y 1), (x 2, y 2), . . ., (x_{N}, y_{N})}$ ，
其中 $x_{i} \in X \subseteq R^{n}, y_{i} \in Y \subseteq R$
輸出提升樹： $f_{K} (x)$

1、初始化 $f_{0} (x) = 0$
2、對 $k = 1, 2, . . ., K$ 依次進行循環迭代：

計算後一顆樹對前一顆樹的殘差： $r_{k i} = y_{i} - f_{k - 1} (x_{i}), i = 1, 2, . . ., N$
擬合殘差學習一個迴歸樹，得到 $T (x, θ_{k})$
更新 $f_{k} (x) = f_{k - 1} (x) + T (x, θ_{k})$
3、通過迭代最終得到迴歸提升樹 $f_{K} (x) = \sum_{k = 1}^{K} T (x, θ_{k})$

GBDT
提升樹利用加法模型與前向分佈算法實現學習的優化過程在損失函數式平方損失和指數損失時，每一步優化是很簡單的。

但對一般損失函數而言，往往每一步優化並不那麼容易。

Freidman提出了梯度提升算法，其關鍵是利用損失函數的負梯度在當前模型的值：

- [\frac{\partial L (y, f (x_{i}))}{\partial f (x_{i})}]_{f (x) = f_{m - 1} (x)}

其中

L (y, f (x_{i}))

是自定義的損失函數，

y

是殘差，

f (x)

是迭代而成的決策樹。

作爲迴歸問題提升樹算法中殘差的近似值來擬合一顆迴歸樹。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

提升樹與梯度提升樹 Boosting Tree & Gradient Boosting Decision Tree(GBDT)

UML 統一建模語言簡明教程一看就懂

釘釘自動點贊腳本適用Android

MultipartUploadRequest 無法從Android傳遞信息到服務器的一種情況

Windows定時任務每隔5分鐘執行一次指定的Python腳本

使用camera2設置全屏TextureView卻不顯示爲全屏的解決辦法

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結