分類問題評價指標：精度、召回率、準確率、F1 score、ROC曲線

原創

2020-06-08 03:44

文章目錄

精度、召回率、準確率、F1 score的概念及ROC曲線

這幾個概念是對應於分類問題的評價指標。

首先我們定義如下表格：

.	Actual Positive	Actual Negative
Predict Positive	True Positive (TP)	False Positive (FP)
Predict Negative	False Negative (FN)	True Negative (TN)

其中：

TP表示正確地把正樣本預測爲正；

FN表示錯誤地把正樣本預測爲負；

FP表示錯誤地把負樣本預測爲正；

TN表示正確地把負樣本預測爲負；

如下是幾個術語的含義：

Name	含義
Accuracy	準確率
Precision	精度
Recall	召回率
F1 score	F1值

1.Precise:表示正確預測正樣本佔實際預測爲正樣本的比例

2.Recall:表示正確預測正樣本佔正樣本的比例

3.F1 score:是對精度和召回率的調和平均

4.Accuracy:表示預測符合標籤的樣本與總樣本的比例

5.受試者特徵曲線（ROC 曲線，Receiver Operating Characteristic curve）
此部分具體可參考此文章

ROC 曲線展示了當改變在模型中識別爲正例的閾值時，召回率和精度的關係會如何變化。如果我們有一個用來識別疾病的模型，我們的模型可能會爲每一種疾病輸出介於 0 到 1 之間的一個分數，爲了將某個病人標記爲患有某種疾病（一個正例標籤），我們爲每種疾病在這個範圍內設置一個閾值，通過改變這個閾值，我們可以嘗試實現合適的精度和召回率之間的平衡。

ROC 曲線在 Y 軸上畫出了真正例率（TPR），在 X 軸上畫出了假正例率 (FPR)。TPR 是召回率，FPR 是反例被報告爲正例的概率。這兩者都可以通過混淆矩陣計算得到。

下圖是一個典型的 ROC 曲線：

通常，當降低閾值時，會沿着曲線向右和向上移動。

我們可以通過計算曲線下面積 ( AUC ) 來量化模型的 ROC 曲線，這是一個介於 0 和 1 之間的度量，數值越大，表示分類性能越好。在上圖中，藍色曲線的 AUC 將大於紅色曲線的 AUC，這意味着藍色模型在實現準確度和召回率的權衡方面更好。隨機分類器 (黑線) 實現 0.5 的 AUC。

總結：

對於二分類問題：

真正例（TP）：實際上是正例的數據點被標記爲正例
假正例（FP）：實際上是反例的數據點被標記爲正例
真反例（TN）：實際上是反例的數據點被標記爲反例
假反例（FN）：實際上是正例的數據點被標記爲反例

召回率和精度衡量指標：

召回率（R）：分類模型識別所有相關實例的能力
精度（P）：分類模型僅僅返回相關實例的能力
F1 score：使用調和平均結合召回率和精度的指標

召回率和精度的可視化：

混淆矩陣：展示分類模型的真實和預測標籤的對應結果。
受試者特徵曲線（ROC 曲線）：畫出真正例率（TPR）和假正例率（FPR），並將此作爲模型歸類正例閾值的函數。
曲線下面積（AUC）：基於 ROC 曲線下方的面積，計算分類模型總體性能的指標。

參考文章：
https://www.jianshu.com/p/1afbda3a04ab
https://blog.csdn.net/wujunlei1595848/article/details/90739786

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

分類問題評價指標：精度、召回率、準確率、F1 score、ROC曲線

文章目錄

精度、召回率、準確率、F1 score的概念及ROC曲線

總結：

對於二分類問題：

召回率和精度衡量指標：

召回率和精度的可視化：

推薦2款開源、美觀的WinForm UI控件庫

NET9 AspnetCore將整合OpenAPI的文檔生成功能而無需三方庫

對於Pandas和Numpy中axis參數的理解

Pandas處理分類數據

2019.12.11

2019.12.14

2019.12.13

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結