（LXTML筆記）Gradient Boosted Decision Tree

原創

2018-09-02 23:26

AdaBoost-DTree

根據AdaBoost的思想，

我們希望在生成多個分類器 $g_{t}$ 的時候，增加一個類似於adaboost的權重 $u_{t}$ ，即 $g_{t} = A (D, u^{t})$ ，在最後組成最終分類器 $G$ 的時候，增加權重 $a_{t} = a_{t} (u^{t})$ ，這是整體的思路。

那麼現在的問題是如何嵌入一個 $u^{t}$ ，使得 $g_{t} = D T r e e (D, u^{t})$ ，注意到之前的Random-Forest等算法中的 $g_{t}$ 僅僅是 $D T r e e (D)$ .

如上圖所示，本來加入 $u^{t}$ 應該是在 $E_{i n}$ 中進行的，但是這不一定能很好地解出，所以這裏講其看成一個black box。注意到 $u^{t}$ 在adaboost是怎麼引進來的，他是由boost抽樣引進的，所以，我們採用紅框所示的抽樣方法。即對每一組數據 $(x_{n}, y_{n})$ 按 $u_{n}$ 的比例概率來抽取，這樣的話可以近似地處理 $E_{i n}$ 且不用改最優化的框架（僅僅是“改”了數據）。

權重 $a_{t}$ 仍採用和adaboost一樣的操作。

adaboost-DT用於二分類問題

如上更新，注意到由於是二分類問題 $y_{n}$ 是±1，那麼 $u^{t}$ 可以有很好地表達式，這個結果和我們要回傳的 $G$ 長得十分類似。

如上圖所示，用一種粗糙的解釋，實際上上上圖中橙色框的部分表示的是一種類似於SVM中的margin，我們希望margin越大越好，即如上圖灰色框所示，我們最終希望 $u^{t + 1}$ 越下越好，那麼我們可以再弱一些，我們希望能deresases $\sum_{n = 1}^{N} u_{n}^{(t)}$ .

採用的是GD，對exp在原點附近泰勒展開後得知我們需要使得 $\sum_{n = 1}^{N} u_{n}^{(t)} (- y_{n} h (x_{n}))$ 最小化，其中 $h (x_{n})$ 是變量，進一步化簡，

這裏的推導說明，實際上最小化 $E_{A D A}$ 相當於最小化 $E_{i n}^{u^{(t)}}$ ，所以推來推去，我們發現了最好的 $g_{t}$ 實際上就是可以通過adaboost來解決的，即 $g_{t + 1}$ 由 $u^{t}$ 和 $g_{t}$ 來獲得，忘記的同學可以回到adaboost去查看。

得到最優的 $g_{t}$ 之後，接下來，我們要處理最優的步長，由上面的推導，我們能得出最優的步長就是 $l n \sqrt{\frac{1 - ϵ_{t}}{ϵ_{t}}}$ ！實在是震精！

Gradient Boosting for Regression

推廣上面adaboost-DT的loss項，可以推廣到一般形式，下面將考慮regression問題，即考慮squared-error。

按照上面的推導的話遇到了一個問題，如果要min只要直接取 $h (x_{n}) = + \infty$ 就好了，不過實際上 $h (x_{n})$ 僅僅是代表一個方向而已（想一想GD），長度應該是由步長控制的，所以，我們嘗試對 $h (x_{n})$ 做點限制，增加一個 $(h (x_{n})^{2})$ 項

通過配方，我們發現了一個驚人的事實，如果假設 $h$ 是線性的話，那麼直接對 ${(x_{n}, y_{n} - s_{n})}$ 做LR即可以得到一個最優解！

得到最優 $h$ 之後，考慮步長，稍微做點代數邊形，我們發現一個事實，最優的步長也是可以通過線性迴歸獲得，而且是一元！

對算法重新總結一下即

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

（LXTML筆記）Gradient Boosted Decision Tree

AdaBoost-DTree

adaboost-DT用於二分類問題

Gradient Boosting for Regression

CoinChange問題(上)——DP&母函數

不等式$\sum x_i^3(1-x_i)\leq\frac{1}{8}$

\sqrt 2爲無理數的新證明

安裝小坑記錄（無sudo權限下）

隨機過程課中的一個復積分問題

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結