九、迴歸——XGBoost算法

原創

2020-06-09 03:18

一、Xgboost模型參數

Xgboost模型有３種類型的參數：通用參數、輔助參數和任務參數。通用參數確定上升過程中上升模型類型，常用樹或線性模型；輔助參數取決於所選的上升模型；任務參數定義學習任務和相應的學習目標。

Xgboost模型中，常用參數說明如下：
（１）Xgboost：設置需要使用的上升模型。可選gbtree（樹）或gblinear（線性函數），默認爲gbtree。

（２）nthread：Xgboost運行時的並行線程數，默認爲當前系統可以獲得的最大可用線程數。

（３）ｅｔａ：收縮步長，即學習速率，取值範圍是，默認爲０．３。在更新葉子節點的時候，權重乘以ｅｔａ，以避免在更新過程中的過擬合。
（４）max_depth：每棵樹的最大深度，取值範圍，默認爲６。樹越深，越容易過擬合。
（５）subsample：訓練的實例樣本佔整體實例樣本的比例，取值範圍是（０，１］，默認爲１。值爲０．５時意味着Xgboost隨機抽取一半的數據實例來生成樹模型，這樣能防止過擬合。
（６）colsample_bytree :在構建每棵樹時，列（特徵）的子樣本比，參數值的範圍是（０，１］。
（７）objective:默認爲ｒｅg:ｌｉｎｅａｒ；
（８）seed：隨機數種子，爲確保數據的可重現性，默認爲０。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

三、迴歸——logistic迴歸二分類的python實現

一、訓練算法：使用梯度上升找到最佳參數 1.使用Logistic迴歸梯度上升優化算法每次更新迴歸係數都要遍歷整個數據集，該算法在處理100左右各樣本時還可以，但是如果有數十億樣本或者成千上萬的特徵，那麼該算法就太過於複雜了

2020-06-20 09:42:36

十、模型自變量選擇方法

在本系列的最後一篇文章中，我們討論了多元線性迴歸模型。費爾南多創建了一個模型，根據五個輸入參數估算汽車價格。費爾南多的確獲得了一個比較好的模型，然而，費爾南多想要獲得最好的輸入變量集本文將詳細介紹模型選擇方法一、概念模型選擇方法

2020-06-09 03:18:03

五、線性迴歸——嶺迴歸Ridge Regression

一、嶺迴歸引進的原因當數據之間存在多重共線性（自變量高度相關）時，就需要使用嶺迴歸分析。在存在多重共線性時，儘管最小二乘法（OLS）測得的估計值不存在偏差，它們的方差也會很大，從而使得觀測值與真實值相差甚遠。嶺迴歸通過給迴歸估計值添加一

2020-06-09 03:18:03

七、迴歸——迴歸預測的評價指標（附python代碼）

目錄一、常用的評價指標 1、SSE(誤差平方和) 2、R-square(決定係數) 3、Adjusted R-Square (校正決定係數）二、python中的sklearn. metrics （1） explained_varian

2020-06-09 03:18:03

六、迴歸——套索迴歸 (Lasso Regression)的基本應用

一、使用場合與嶺迴歸類似，套索 (Least Absolute Shrinkage and Selection Operator) 也會對迴歸係數的絕對值添加一個罰值。此外，它能降低偏差並提高線性迴歸模型的精度。看看下面的等式：套索

2020-06-09 03:18:03

四、迴歸——LinearRegression

一、官方文檔 class sklearn.linear_model.LinearRegression(fit_intercept=True, normalize=False, copy_X=True, n_jobs=1) 1.參數： Or

2020-06-09 03:18:03

二、迴歸——logistic regression實現多類別分類的實現

2020-02-21 00:58:23

一、迴歸——sklearn.linear_model.LogisticRegression官方文檔

2020-02-21 00:58:23

三、迴歸——logistic迴歸二分類的python實現

一、訓練算法：使用梯度上升找到最佳參數 1.使用Logistic迴歸梯度上升優化算法每次更新迴歸係數都要遍歷整個數據集，該算法在處理100左右各樣本時還可以，但是如果有數十億樣本或者成千上萬的特徵，那麼該算法就太過於複雜了

2020-06-20 09:42:36

十、模型自變量選擇方法

在本系列的最後一篇文章中，我們討論了多元線性迴歸模型。費爾南多創建了一個模型，根據五個輸入參數估算汽車價格。費爾南多的確獲得了一個比較好的模型，然而，費爾南多想要獲得最好的輸入變量集本文將詳細介紹模型選擇方法一、概念模型選擇方法

2020-06-09 03:18:03

五、線性迴歸——嶺迴歸Ridge Regression

一、嶺迴歸引進的原因當數據之間存在多重共線性（自變量高度相關）時，就需要使用嶺迴歸分析。在存在多重共線性時，儘管最小二乘法（OLS）測得的估計值不存在偏差，它們的方差也會很大，從而使得觀測值與真實值相差甚遠。嶺迴歸通過給迴歸估計值添加一

2020-06-09 03:18:03

七、迴歸——迴歸預測的評價指標（附python代碼）

目錄一、常用的評價指標 1、SSE(誤差平方和) 2、R-square(決定係數) 3、Adjusted R-Square (校正決定係數）二、python中的sklearn. metrics （1） explained_varian

2020-06-09 03:18:03

六、迴歸——套索迴歸 (Lasso Regression)的基本應用

一、使用場合與嶺迴歸類似，套索 (Least Absolute Shrinkage and Selection Operator) 也會對迴歸係數的絕對值添加一個罰值。此外，它能降低偏差並提高線性迴歸模型的精度。看看下面的等式：套索

2020-06-09 03:18:03

四、迴歸——LinearRegression

一、官方文檔 class sklearn.linear_model.LinearRegression(fit_intercept=True, normalize=False, copy_X=True, n_jobs=1) 1.參數： Or

2020-06-09 03:18:03

二、迴歸——logistic regression實現多類別分類的實現

2020-02-21 00:58:23

24小時熱門文章

最新文章

最新評論文章