概念
ROC曲線,也稱受試者工作特徵曲線,感受性曲線;
ROC曲線最初運用於軍事上,當前ROC曲線在醫學領域有着廣泛的使用。醫學上更多稱爲“陽性”(比如敵機)或“陰性”(比如飛鳥),對應着X軸即1-特異性也稱爲假陽性率(誤報率),該值越小越好;Y軸敏感度也稱爲真陽性率(敏感度),該值越大越好。
名詞 | 說明 |
---|---|
特異性 | 陰性人羣中,檢測出陰性的機率。也稱真陰性率。 |
敏感度 | 陽性人羣中,檢測出陽性的機率。也稱真陽性率。(敏感度) |
假陰性率 | 陽性人羣中,檢測爲陰性的機率,也稱假陰性率。 |
ROC曲線 | 以1-特異性(誤報率)爲X軸,敏感度爲Y軸,繪製的曲線。 |
AUC | ROC曲線下的面積,表示預測準確率。越大越好。 |
AUC意義
ROC曲線是以1 - 特異性即誤報率爲X軸,以特異性(敏感度)作爲Y軸而建立的拆線圖。ROC曲線以下的面積值代表着預測的準確率情況,稱其爲AUC值。顯然,AUC越大,意味着預測準確率越高,反之說明預測準確率越低。AUC值介於0到1之間,關於AUC值的判斷說明如下:
AUC<0.5:不符合實際情況, 預測診斷比隨機性猜測還差,實際情況中不應該出現;
AUC=0.5:說明完全無預測診斷價值,預測準確率和猜測效果一樣;
0.5< AUC <0.7:預測診斷價值很低,此種情況相對較常見;
0.7<=AUC<0.9:預測診斷價值高,此種情況較常見;
AUC>=0.9:說明預測診斷價值高,此種情況較好;
AUC = 1,是完美預測沒有瑕疵,絕大多數情況下,不存在完美的預測診斷。
參考:ROC曲線 http://spssau.com/front/spssau/helps/visualization/roc.html
全面瞭解ROC曲線 https://www.plob.org/article/12476.html
ROC曲線 https://wenku.baidu.com/view/9731f168804d2b160b4ec054.html
library("pROC")
df<- read.table("test.txt", header = T)
> head(df)
status percent
1 0 0
2 1 0
3 0 0
4 0 4
5 1 23.23
6 0 0
roc(df$status, df$percent)
roc(df$status, df$percent, plot=TRUE, print.thres=TRUE, print.auc=TRUE)