利用SHAP解釋Xgboost模型
Xgboost相對於線性模型在進行預測時往往有更好的精度,但是同時也失去了線性模型的可解釋性。所以Xgboost通常被認爲是黑箱模型。
2017年,Lundberg和Lee的論文提出了SHAP值這一廣泛適用的方法用來解釋各種模型(分類以及迴歸),其中最大的受益者莫過於之前難以被理解的黑箱模型,如xgboost和神經網絡模型。
本教程中,我們在真實數據集上進行實操,利用SHAP來解釋Xgboost模型。
預計學習用時:30分鐘。
本教程基於Python 3.6版本、Xgboost 0.82版本以及shap 0.28.5版本。
完整教程以及代碼地址:
【教程】SHAP值解釋xgboost模型的特徵重要性-SofaSofa