ROC曲线理解以及实践

概念

ROC曲线,也称受试者工作特征曲线,感受性曲线;

ROC曲线最初运用于军事上,当前ROC曲线在医学领域有着广泛的使用。医学上更多称为“阳性”(比如敌机)或“阴性”(比如飞鸟),对应着X轴即1-特异性也称为假阳性率(误报率),该值越小越好;Y轴敏感度也称为真阳性率(敏感度),该值越大越好。

名词 说明
特异性 阴性人群中,检测出阴性的机率。也称真阴性率。
敏感度 阳性人群中,检测出阳性的机率。也称真阳性率。(敏感度)
假阴性率 阳性人群中,检测为阴性的机率,也称假阴性率。
ROC曲线 以1-特异性(误报率)为X轴,敏感度为Y轴,绘制的曲线。
AUC ROC曲线下的面积,表示预测准确率。越大越好。
AUC意义

ROC曲线是以1 - 特异性即误报率为X轴,以特异性(敏感度)作为Y轴而建立的拆线图。ROC曲线以下的面积值代表着预测的准确率情况,称其为AUC值。显然,AUC越大,意味着预测准确率越高,反之说明预测准确率越低。AUC值介于0到1之间,关于AUC值的判断说明如下:

AUC<0.5:不符合实际情况, 预测诊断比随机性猜测还差,实际情况中不应该出现;

AUC=0.5:说明完全无预测诊断价值,预测准确率和猜测效果一样;

0.5< AUC <0.7:预测诊断价值很低,此种情况相对较常见;

0.7<=AUC<0.9:预测诊断价值高,此种情况较常见;

AUC>=0.9:说明预测诊断价值高,此种情况较好;

AUC = 1,是完美预测没有瑕疵,绝大多数情况下,不存在完美的预测诊断。

在这里插入图片描述参考:ROC曲线 http://spssau.com/front/spssau/helps/visualization/roc.html
全面了解ROC曲线 https://www.plob.org/article/12476.html
ROC曲线 https://wenku.baidu.com/view/9731f168804d2b160b4ec054.html

library("pROC")
df<- read.table("test.txt", header = T)

> head(df)
status percent
1      0       0
2      1       0
3      0       0
4      0       4
5      1       23.23
6      0       0

roc(df$status, df$percent)
roc(df$status, df$percent, plot=TRUE, print.thres=TRUE, print.auc=TRUE)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章