评分卡模型验证常用指标

在模型训练及验证之前，需进行好坏用户的划分，可通过有贷后表现根据阈值进行划分，其中坏用户定义为1，好用户定义为0,基于此对模型验证指标进行说明。

		实际表现
		1	0
预测表现	1	TP(true positive 预测正确的坏用户个数)	FP(false positive 预测错误的坏用户个数)
	0	FN(false negative 预测错误的好用户个数)	TN(true negative 预测正确的好用户个数)

其中：

评价标准：

ROC
计算方式：
1.计算每个样本区间的TPR：TPR=TP/(TP+FN),FPR=FP/(FP+TN)
2.以FPR为x轴，TPR为y轴画图，获得ROC曲线
AUC
计算方式：
AUC为ROC曲线下的面积，一般AUC在0.5到1之间，AUC越高，模型的区分能力越好。
GINI系数
Gini coefficient用以衡量模型风险区分能力，用来衡量分布平衡程度，值的范围为0~1，计算方式：均匀分布直线与洛伦兹曲线之间的面积/均匀分布直线下的面积，即G=A/(A+B)。

计算方式：
gini系数 = A / (A + B) = (AUC - C) / (A + B) = (AUC -0.5) / 0.5 = 2*AUC - 1（其中C=A+B）；
PSI
稳定度指标PSI，用于衡量测试样本即模型开发样本评分的分布差异。PSI表示的就是按分数分档后，针对不同样本，或者不同时间的样本，population分布是否有变化，就是看各个分数区间内人数占总人数的占比是否有显著变化。
计算方式：
1.获取各评分区间样本实际占比Ac，与预测占比Ex，
2.PSI=sum((Ac-Ex)*ln(Ac/Ex))

稳定性测试分为两块，一个是样本外测试，一个是时间外测试；

LIFT
lift用来衡量一个模型是否有效，其值为应用模型对目标响应的预测能力优于随机响应的倍数，lift值越大，模型运行效果越好。
计算方式：
Lift=(TP/(TP+FP))/(P/(P+N))
即实际为坏样本中预测正确的比例与随机分配坏样本的比例的比值。
GAIN
用来描述模型的整体精准度；
计算方式：
Gain=TP/(TP+FP)
参考url：
https://staesthetic.wordpress.com/2014/04/14/gini-roc-auc-and-accuracy/
https://blog.csdn.net/shy19890510/article/details/79501582
https://blog.csdn.net/pipisorry/article/details/52574156
https://zh.wikipedia.org/wiki/基尼系数
 http://www.mamicode.com/info-detail-2307541.html