分類問題評價指標:精度、召回率、準確率、F1 score、ROC曲線

精度、召回率、準確率、F1 score的概念及ROC曲線

這幾個概念是對應於分類問題的評價指標。

首先我們定義如下表格:

. Actual Positive Actual Negative
Predict Positive True Positive (TP) False Positive (FP)
Predict Negative False Negative (FN) True Negative (TN)

其中:

TP表示正確地把正樣本預測爲正;

FN表示錯誤地把正樣本預測爲負;

FP表示錯誤地把負樣本預測爲正;

TN表示正確地把負樣本預測爲負;

如下是幾個術語的含義:

Name 含義
Accuracy 準確率
Precision 精度
Recall 召回率
F1 score F1值

1.Precise:表示正確預測正樣本佔實際預測爲正樣本的比例
在這裏插入圖片描述

2.Recall:表示正確預測正樣本佔正樣本的比例
在這裏插入圖片描述

3.F1 score:是對精度和召回率的調和平均
在這裏插入圖片描述

4.Accuracy:表示預測符合標籤的樣本與總樣本的比例
在這裏插入圖片描述

5.受試者特徵曲線(ROC 曲線,Receiver Operating Characteristic curve)
此部分具體可參考此文章

ROC 曲線展示了當改變在模型中識別爲正例的閾值時,召回率和精度的關係會如何變化。如果我們有一個用來識別疾病的模型,我們的模型可能會爲每一種疾病輸出介於 0 到 1 之間的一個分數,爲了將某個病人標記爲患有某種疾病(一個正例標籤),我們爲每種疾病在這個範圍內設置一個閾值,通過改變這個閾值,我們可以嘗試實現合適的精度和召回率之間的平衡。

ROC 曲線在 Y 軸上畫出了真正例率(TPR),在 X 軸上畫出了假正例率 (FPR)。TPR 是召回率,FPR 是反例被報告爲正例的概率。這兩者都可以通過混淆矩陣計算得到。

在這裏插入圖片描述

下圖是一個典型的 ROC 曲線:
在這裏插入圖片描述
通常,當降低閾值時,會沿着曲線向右和向上移動。

我們可以通過計算曲線下面積 ( AUC ) 來量化模型的 ROC 曲線,這是一個介於 0 和 1 之間的度量,數值越大,表示分類性能越好。在上圖中,藍色曲線的 AUC 將大於紅色曲線的 AUC,這意味着藍色模型在實現準確度和召回率的權衡方面更好。隨機分類器 (黑線) 實現 0.5 的 AUC。

總結:

對於二分類問題:

真正例(TP):實際上是正例的數據點被標記爲正例
假正例(FP):實際上是反例的數據點被標記爲正例
真反例(TN):實際上是反例的數據點被標記爲反例
假反例(FN):實際上是正例的數據點被標記爲反例

召回率和精度衡量指標:

召回率(R):分類模型識別所有相關實例的能力
精度(P):分類模型僅僅返回相關實例的能力
F1 score:使用調和平均結合召回率和精度的指標

召回率和精度的可視化:

混淆矩陣:展示分類模型的真實和預測標籤的對應結果。
受試者特徵曲線(ROC 曲線):畫出真正例率(TPR)和假正例率(FPR),並將此作爲模型歸類正例閾值的函數。
曲線下面積(AUC):基於 ROC 曲線下方的面積,計算分類模型總體性能的指標。

參考文章:
https://www.jianshu.com/p/1afbda3a04ab
https://blog.csdn.net/wujunlei1595848/article/details/90739786

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章