機器學習教程之加性模型：GBDT退化爲AdaBoost原理

Gradient boosting是一種廣泛被用於迴歸、分類和排序任務的集成方法，於2001年被Friedman提出
該類算法通過以上一輪基學習器的誤差的負梯度爲訓練目標訓練本輪的基學習器，不斷降低集成模型在訓練集上的偏差實現高精度的集成
基於Gradient Boosting算法的學習器被稱爲Gradient Boosting Machine（GBM），如果說AdaBoost是boosting方法的開山之作，那麼GBM就是boosting方法的集大成者。GBM幾乎刷新了各個領域衆多數據集的精度記錄，有人認爲GBM是性能最好的機器學習方法，這種說法有點激進，但通常各類數據競賽贏家的策略裏也確實都會有這類算法的方法或者思想

由於集成學習方法在實際應用中出色的性能，我曾經寫過幾篇這方面的博文，關於集成學習及其boosting方法的

機器學習教程之 Boosting 與 bagging：集成學習框架
 人工智能裏的數學修煉 | AdaBoost的數學原理：分佈更新推導
 機器學習教程之集成學習算法：深入刨析AdaBoost

還有一片關於 bagging 類隨機森林的
機器學習教程之隨機森林：算法及其特徵選擇原理

關於GBDT的博客有
機器學習教程之梯度提升方法：GBDT及其擴展模型XGBoost
機器學習教程之梯度提升方法：GBDT處理分類問題
感興趣的朋友可以瞭解一下，可以幫助你們更好的瞭解集成學習的整體情況, 而這篇博客要講述的內容是，GBDT在何種情況下會退化爲AdaBoost

GBDT退化爲AdaBoost原理

Boosting在集成學習領域是非常耀眼的一類方法，其中又以AdaBoost和GBDT最爲突出，AdaBoost是Adaptive Boosting的簡稱，在人臉識別和處理不均勻數據相關領域得到廣泛引用；GBDT 更是被稱爲最強學習器，在各類數據競賽中得到追捧。這兩類方法都是集成模型，其構造方法是通過構造多個弱分類器來組成一個強分類器，且他們同屬於Boosting框架，那麼AdaBoost和GBDT有什麼區別呢？

這兩者的最大區別在於， AdaBoost不屬於梯度提升方法（Gradient Boosting），即它在構造集成模型的時候沒有用到梯度下降的思想，而是用的 Forward Stagewise Additive Modeling （分步前向加性模型，FSAM）。這個模型和方法在之前的機器學習教程之梯度提升方法：GBDT及其擴展模型XGBoost 已經詳細介紹過，爲了後面更好的描述，這裏簡單再說一下
集成模型的加性模型

F_{m} (x) = \sum_{m = 1}^{M} α_{m} f_{m} (x)

等價於

F_{m} (x) = F_{m - 1} (x) + α_{m} f_{m} (x)

這個加性模型的求解，嚴格上要求我們同時找出所有的

a l p h a_{m}

和

f_{m}

, 這是一個非常困難的問題，因此我們採用分步求解的方法，每一步找出一個合適的

a l p h a

和

f

。假設我們已經得到了前

m - 1

個弱學習器，即

F_{m - 1} (x)

, 我們針對損失函數

L

進行優化有

如果損失函數爲平方差函數，則我們有

這裏的

y_{i} - F_{m - 1} (x_{i})

就是當前模型在數據上的殘差，可以看出，求解合適的

a l p h a

和

f

就是在當前的殘差上擬合一個弱的分類器，而且損失函數還是平方差損失函數。這和GBDT選擇平方差損失函數時構造弱分類器的方法恰好一致
而如果損失函數是指數形式，即

則有

上式中的

w_{i}^{m - 1} = e x p (- y_{i} (F_{m - 1} (x_{i})))

和要求解的

a l p h a_{m}

和

f_{m}

無關，與樣本有關，可以理解爲樣本權重，因此，在這種情況下，構造弱分類器就是在對樣本設置權重後的數據上擬合，且損失函數還是指數形式，這也正式AdaBoost的形式。不過值得一提的是，最早的AdaaBoost並不是從這個思路推出來的，在AdaBoost提出5年後，人們纔開始從FSAM的角度來解釋AdaBoost的原理

機器學習教程之加性模型：GBDT退化爲AdaBoost原理

GBDT退化爲AdaBoost原理

再談23種設計模式（3）：行爲型模式（學習筆記）

Power Automate Desktop 安裝完，登錄後老是提示one driver 錯誤

微前端學習筆記(4):從微前端到微模塊之EMP與hel-micro方案探索

微前端學習筆記（1）：微前端總體架構概述，從微服務發微

985 碩士程序員，空窗 4 個月沒有 Offer！

一文搞懂 Spring 循環依賴

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

VScode右鍵打開(添加到右鍵)

記一次 .NET某工控視覺自動化系統卡死分析

WindowsServer--SQL Server搭建主從同步實現讀寫分離 - 事務性分發

DeepLearning | 圖卷積網絡基於拓撲結構的分類（T-GCN）

機器學習教程之半監督學習基於圖正則項的半監督極限學習機

機器學習教程之 EM算法：高斯混合模型聚類算法 (python基於《統計學習方法》實現，附數據集和代碼)

人工智能裏的數學修煉 | 隱馬爾可夫模型：前向後向算法

DeepLearning | Zero Shot Learning 零樣本學習零樣本工業故障診斷

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

機器學習教程 之 加性模型：GBDT退化爲AdaBoost原理

GBDT退化爲AdaBoost原理

機器學習教程之加性模型：GBDT退化爲AdaBoost原理