评分卡模型验证常用指标

在模型训练及验证之前,需进行好坏用户的划分,可通过有贷后表现根据阈值进行划分,其中坏用户定义为1,好用户定义为0,基于此对模型验证指标进行说明。

  • 混淆矩阵(confusion matrix)
实际表现
1 0
预测表现
1TP(true positive 预测正确的坏用户个数)FP(false positive 预测错误的坏用户个数)
0FN(false negative 预测错误的好用户个数)TN(true negative 预测正确的好用户个数)
  • 精确率/查准率
    计算方式:
    精确率(Precision)=TP/(TP+FP),即预测为坏人中预测正确的坏人占比;

  • 召回率/查全率
    计算方式:
    召回率(Recall)=TP/(TP+FN),即实际为坏人中预测正确的坏人占比;

  • F1 值
    用来衡量二分类模型精确度的指标,综合了分类模型的准确率和召回率。
    计算方式:
    F1=2PR/(P+R)
    即精确率与召回率的调和平均值,P指精确率,R指召回率,为综合指标;
    加权一般形式:
    在这里插入图片描述

其中:

β值 说明
β=1 P、R权重相等,即F1
β>1R的权重>P的权重
β<1 R的权重小于P的权重
  • K-S值
    ks值用于对模型风险区分能力进行评估,指标为好坏样本累计部分的插值,一般K-S曲线的最大值代表K-S统计量,ks指标越大,模型风险区分能力越强。
    计算方式:
    1.计算每个样本区间的TPR(真正率/召回率:实际为坏人中预测为坏人的比例)与FPR(假正率:实际中为好人预测为坏人的比例):TPR=TP/(TP+FN),FPR=FP/(FP+TN),即累计TP/(TP+FN) 与累计FP/(FP+TN);
    2.将样本分布区间排序,计算每个区间:|TPR-FPR|,获取每个区间绝对值的最大值,即max(|TPR-FPR|),为评分卡的K-S值。
    如图范例,纵轴为TPR与FPR,横轴为样本占比:
    在这里插入图片描述

评价标准:

k-s值(%)划分说明
<20模型无鉴别能力
20~40模型效果勉强接受
41~50模型具有区别能力
51~60模型有很好的区别能力
61~75模型有非常好的区别能力
>75模型异常,可能有问题
  • ROC
    计算方式:
    1.计算每个样本区间的TPR:TPR=TP/(TP+FN),FPR=FP/(FP+TN)
    2.以FPR为x轴,TPR为y轴画图,获得ROC曲线

  • AUC
    计算方式:
    AUC为ROC曲线下的面积,一般AUC在0.5到1之间,AUC越高,模型的区分能力越好。

  • GINI系数
    Gini coefficient用以衡量模型风险区分能力,用来衡量分布平衡程度,值的范围为0~1,计算方式:均匀分布直线与洛伦兹曲线之间的面积/均匀分布直线下的面积,即G=A/(A+B)。
    在这里插入图片描述
    计算方式:
    gini系数 = A / (A + B) = (AUC - C) / (A + B) = (AUC -0.5) / 0.5 = 2*AUC - 1(其中C=A+B);

  • PSI
    稳定度指标PSI,用于衡量测试样本即模型开发样本评分的分布差异。PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化。
    计算方式:
    1.获取各评分区间样本实际占比Ac,与预测占比Ex,
    2.PSI=sum((Ac-Ex)*ln(Ac/Ex))

PSI划分说明
<10%稳定性很高,无需更新模型
<10%~25%稳定性一般,需要进一步研究
>25%稳定性差,需要更新模型
稳定性测试分为两块,一个是样本外测试,一个是时间外测试;
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章