本文適用包括決策樹在內的多個ML算法模型。
1、二分類、多分類問題的precision、recall
(1)在信息檢索中,精確率通常用於評價結果的質量,而召回率用來評價結果的完整性。瞭解其概念,參考——
《準確率(Accuracy), 精確率(Precision), 召回率(Recall)和F1-Measure》
(2)在多分類問題應用這些概念,把每個類別單獨視爲"正",所有其它類型視爲"負"。
2、混淆矩陣及其使用seaborn繪圖
(1)混淆矩陣和seaborn繪圖部分參考——
3、sklearn各種模型函數的使用(classification_report,confusion_matrix,acc_score,recall_score,precision_score,F1_score等等)
(1)算是非常詳細的講解二分類、多分類中sklearn各種模型函數的使用,參考博文——
(2)classification_report中有Macro avg、Micro avg三種平均法。
- Macro:反映了模型對數據集整體的表現,但是不能具體去分析某一類別的性能。
- Micro:當數據中類別不平均時(如果極度不平均,有一個類別只有1個,無論分類結果對或錯,用Macro的時候都將嚴重會影響最終的平均指標),可以作爲一個有效的指標反映模型性能。
如果讀不懂新版本sklearn中的classification_report,可以參考博文——
《讀懂 sklearn 的 classification_report》
(3)決策樹分類效果評價指標詳解,稍微講了下ROC、AUC曲線等
可以參考博文——
《決策樹分類效果評價指標詳解》