sklearn中的模型評估(分類報告classification_report,混淆矩陣confusion_matrix,準確率acc,召回率recall等)

本文適用包括決策樹在內的多個ML算法模型。

1、二分類、多分類問題的precision、recall

(1)在信息檢索中,精確率通常用於評價結果的質量,而召回率用來評價結果的完整性。瞭解其概念,參考——

《準確率(Accuracy), 精確率(Precision), 召回率(Recall)和F1-Measure》

(2)在多分類問題應用這些概念,把每個類別單獨視爲"正",所有其它類型視爲"負"。

參考——
《多分類問題中的精確率與召回率 自己代碼實現》


2、混淆矩陣及其使用seaborn繪圖

(1)混淆矩陣和seaborn繪圖部分參考——

《混淆矩陣》


3、sklearn各種模型函數的使用(classification_report,confusion_matrix,acc_score,recall_score,precision_score,F1_score等等)

(1)算是非常詳細的講解二分類、多分類中sklearn各種模型函數的使用,參考博文——

《sklearn中的模型評估-構建評估函數》

(2)classification_report中有Macro avg、Micro avg三種平均法。
  • Macro:反映了模型對數據集整體的表現,但是不能具體去分析某一類別的性能。
  • Micro:當數據中類別不平均時(如果極度不平均,有一個類別只有1個,無論分類結果對或錯,用Macro的時候都將嚴重會影響最終的平均指標),可以作爲一個有效的指標反映模型性能。

如果讀不懂新版本sklearn中的classification_report,可以參考博文——
《讀懂 sklearn 的 classification_report》

(3)決策樹分類效果評價指標詳解,稍微講了下ROC、AUC曲線等

可以參考博文——
《決策樹分類效果評價指標詳解》


4、遇到的問題:UndefinedMetricWarning: Precision and F-score are ill-defined and being set to 0.0 in labels

《出現原因及解決辦法——ignore》

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章