sklearn接口的xgboost 分類器:
xgboost.XGBClaaifier()
xgboost.fit(x,y)
1. xgboost.predict(test_x)
2. xgboost.predict_proba(test_x)
3. xgboost.score(test_x,y)
討論:
結果1“可能”不準,因爲predict默認採用0.5做閾值;另外,score也是利用0.5做閾值計算的分數。
而如果根據predict_proba,我們分析不同閾值下的正確率分數,會發現在某些閾值下,正確率分數會更高。
非sklearn接口的xgboost分類器:
xgboost.train()
xgboost.predict() 只會輸出概率或sigmoid轉換前的貢獻度model_a.predict(pred_contribs= True),需要人工指定閾值,才能做分類。