概念
ROC曲线,也称受试者工作特征曲线,感受性曲线;
ROC曲线最初运用于军事上,当前ROC曲线在医学领域有着广泛的使用。医学上更多称为“阳性”(比如敌机)或“阴性”(比如飞鸟),对应着X轴即1-特异性也称为假阳性率(误报率),该值越小越好;Y轴敏感度也称为真阳性率(敏感度),该值越大越好。
名词 | 说明 |
---|---|
特异性 | 阴性人群中,检测出阴性的机率。也称真阴性率。 |
敏感度 | 阳性人群中,检测出阳性的机率。也称真阳性率。(敏感度) |
假阴性率 | 阳性人群中,检测为阴性的机率,也称假阴性率。 |
ROC曲线 | 以1-特异性(误报率)为X轴,敏感度为Y轴,绘制的曲线。 |
AUC | ROC曲线下的面积,表示预测准确率。越大越好。 |
AUC意义
ROC曲线是以1 - 特异性即误报率为X轴,以特异性(敏感度)作为Y轴而建立的拆线图。ROC曲线以下的面积值代表着预测的准确率情况,称其为AUC值。显然,AUC越大,意味着预测准确率越高,反之说明预测准确率越低。AUC值介于0到1之间,关于AUC值的判断说明如下:
AUC<0.5:不符合实际情况, 预测诊断比随机性猜测还差,实际情况中不应该出现;
AUC=0.5:说明完全无预测诊断价值,预测准确率和猜测效果一样;
0.5< AUC <0.7:预测诊断价值很低,此种情况相对较常见;
0.7<=AUC<0.9:预测诊断价值高,此种情况较常见;
AUC>=0.9:说明预测诊断价值高,此种情况较好;
AUC = 1,是完美预测没有瑕疵,绝大多数情况下,不存在完美的预测诊断。
参考:ROC曲线 http://spssau.com/front/spssau/helps/visualization/roc.html
全面了解ROC曲线 https://www.plob.org/article/12476.html
ROC曲线 https://wenku.baidu.com/view/9731f168804d2b160b4ec054.html
library("pROC")
df<- read.table("test.txt", header = T)
> head(df)
status percent
1 0 0
2 1 0
3 0 0
4 0 4
5 1 23.23
6 0 0
roc(df$status, df$percent)
roc(df$status, df$percent, plot=TRUE, print.thres=TRUE, print.auc=TRUE)