xgboost: predict 和 predict_proba 分類器正確率計算的討論

sklearn接口的xgboost 分類器:

xgboost.XGBClaaifier()

xgboost.fit(x,y)

1. xgboost.predict(test_x)  

2. xgboost.predict_proba(test_x)

3. xgboost.score(test_x,y)

討論:

結果1“可能”不準,因爲predict默認採用0.5做閾值;另外,score也是利用0.5做閾值計算的分數。

而如果根據predict_proba,我們分析不同閾值下的正確率分數,會發現在某些閾值下,正確率分數會更高。

 

 

非sklearn接口的xgboost分類器:

xgboost.train()

xgboost.predict() 只會輸出概率或sigmoid轉換前的貢獻度model_a.predict(pred_contribs= True),需要人工指定閾值,才能做分類。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章