九、迴歸——XGBoost算法

 

一、Xgboost模型參數

         Xgboost模型有3種類型的參數:通用參數、輔助參數和任務參數。通用參數確定上升過程中上升模型類型,常用樹或線性模型;輔助參數取決於所選的上升模型;任務參數定義學習任務和相應的學習目標。

Xgboost模型中,常用參數說明如下:
(1)Xgboost:設置需要使用的上升模型。可選gbtree(樹)或gblinear(線性函數),默認爲gbtree。

(2)nthread:Xgboost運行時的並行線程數,默認爲當前系統可以獲得的最大可用線程數。

(3)eta:收縮步長,即學習速率,取值範圍是,默認爲0.3。在更新葉子節點的時候,權重乘以eta,以避免在更新過程中的過擬合。
(4)max_depth:每棵樹的最大深度,取值範圍,默認爲6。樹越深,越容易過擬合。
(5)subsample:訓練的實例樣本佔整體實例樣本的比例,取值範圍是(0,1],默認爲1。值爲0.5時意味着Xgboost隨機抽取一半的數據實例來生成樹模型,這樣能防止過擬合。
(6)colsample_bytree :在構建每棵樹時,列(特徵)的子樣本比,參數值的範圍是(0,1]。
(7)objective:默認爲reg:linear;
(8)seed:隨機數種子,爲確保數據的可重現性,默認爲0。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章