對於數據測試結果有下面4種情況:
TP: 預測爲正,實際爲正
FP: 預測爲正,實際爲負
TN:預測爲負,實際爲負
FN: 預測爲負,實際爲正
準確率:
Accuracy=(TP+TN)/(TP+TN+FN+FP),即預測正確的概率
精確率:
又名查準率,P = TP/ (TP+FP),即預測爲正的正確率
召回率:
又名查全率,R = TP/ (TP+FN),即正樣本的正確率
真正確率:
同召回率,查全率,TPR = TP/ (TP+FN),即正樣本的正確率
假正確率:
FPR =FP/ (FP+TN),即負樣本的錯誤率
PR曲線:
y軸爲精確率,x軸爲召回率,越偏右上越好(都很高),但實際兩者相互掣肘,難以同時滿足。
ROC曲線:
y軸爲真正例率,x軸爲假正例率,越偏左上越好
AUC值:
ROC曲線下的面積,值介於0.5到1.0之間,較大的AUC代表了較好的performance。AUC值表示,隨機抽取一個正樣本和一個負樣本,分類器正確給出正樣本的score高於負樣本的概率。