常見分類性能度量指標

原創

zoe_cf

2019-06-22 04:08

常見分類性能度量指標

常見分類性能度量指標

再將這幾個指標之前，先講幾個基礎概念

真正(True Positive , TP)：被模型預測爲正的正樣本。
假正(False Positive , FP)：被模型預測爲正的負樣本。
假正(False Negative , FN)：被模型預測爲負的正樣本。
真負(True Negative , TN)：被模型預測爲負的負樣本。

準確率

$Accuracy = \frac{TP+TN}{TP+FN+FP+TN}$

精確率

又叫正確率，查準率。是計算預測爲正樣本里邊真正爲正樣本的概率

$Precision = \frac{TP}{TP+FP}$

召回率

又叫靈敏度，查全率，這個在類別不均衡的情況下，可以當做一個很重要的衡量指標

$Sensitivity = Recall = \frac{TP}{TP+FN}$

F1 值

F值是精確率和召回率的調和值，更接近於兩個數較小的那個，所以精確率和召回率接近時，F值最大。很多推薦系統的評測指標就是用F值的。

$\frac{2}{F1} = \frac{1}{Precision } + \frac{1}{Recall}$

ROC曲線

接收者操作特徵曲線（receiver operating characteristic curve），是反映敏感性和特異性連續變量的綜合指標，roc曲線上每個點反映着對同一信號刺激的感受性。ROC曲線有個很好的特性：當測試集中的正負樣本的分佈變化的時候，ROC曲線能夠保持不變。在實際的數據集中經常會出現類不平衡（class imbalance）現象，即負樣本比正樣本多很多（或者相反），而且測試數據中的正負樣本的分佈也可能隨着時間變化。

https://scikit-learn.org/stable/auto_examples/model_selection/plot_roc.html

橫座標爲False Positive Rate(FPR假正率)，縱座標爲True Positive Rate(TPR真正率)

目標最好點在靠近左下角，即

理想目標：TPR=1，FPR=0，即圖中(0,1)點，故ROC曲線越靠攏(0,1)點，越偏離45度對角線越好。一般來說，如果ROC是光滑的，那麼基本可以判斷沒有太大的overfitting

AUC曲線

Area Under Curve，被定義爲ROC曲線下的面積(ROC的積分)。使用AUC值作爲評價標準是因爲很多時候ROC曲線並不能清晰的說明哪個分類器的效果更好，而作爲一個數值，對應AUC更大的分類器效果更好。

PR曲線

PR曲線的橫座標是精確率Precision，縱座標是召回率Recall。評價標準和ROC一樣，先看平滑不平滑。一般來說，在同一測試集，上面的比下面的好（綠線比紅線好）。當P和R的值接近時，F1值最大。

https://scikit-learn.org/stable/auto_examples/model_selection/plot_precision_recall.html

當正負樣本數量差距不大的情況下，ROC和PR的趨勢是差不多的，但是在正負樣本分佈極不均衡的情況下，PR比ROC更能真實的反映出實際情況，因爲此時ROC曲線看起來似乎很好，但是卻在PR上效果一般。
https://www.zhihu.com/question/30643044/answer/48955833

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

常見分類性能度量指標

常見分類性能度量指標

準確率

精確率

召回率

F1 值

ROC曲線

AUC曲線

PR曲線

第四章用戶畫像管理

ML：線性迴歸

循環和遞歸神經網絡

Attention原理

BERT語言模型

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結