ROC曲線一般用於分類問題,衡量分類模型好壞的一個指標
首先對樣本進行如下劃分
|
預測真 |
預測假 |
實際真 |
TP(True Positive) |
FN(False Negative) |
實際假 |
FP(False Positive) |
TN(True Negative) |
概念一:真正類率 (true positive rate ,TPR) TPR = TP/(TP+FN)
概念二:負正類率(false positive rate, FPR)FPR=FP/(FP+TN)
ROC橫座標是FPR,縱座標是TPR
延伸一:ROC與橫座標組成的面積爲AUC,AUC越大說明模型性能越好
精確率定義爲:
準確率描述的是預測爲真的樣本中實際爲真的概率
召回率定義爲:
召回率定義爲實際爲真的樣本中預測爲真的概率
若要求提高準確率,不在意召回率的時候,我們可以減少召回的數量,極端情況,只召回一個我們認爲最爲可能的物料,如果實際爲真那麼準確率就是100%