評分卡模型驗證常用指標

在模型訓練及驗證之前，需進行好壞用戶的劃分，可通過有貸後表現根據閾值進行劃分，其中壞用戶定義爲1，好用戶定義爲0,基於此對模型驗證指標進行說明。

		實際表現
		1	0
預測表現	1	TP(true positive 預測正確的壞用戶個數)	FP(false positive 預測錯誤的壞用戶個數)
	0	FN(false negative 預測錯誤的好用戶個數)	TN(true negative 預測正確的好用戶個數)

其中：

評價標準：

ROC
計算方式：
1.計算每個樣本區間的TPR：TPR=TP/(TP+FN),FPR=FP/(FP+TN)
2.以FPR爲x軸，TPR爲y軸畫圖，獲得ROC曲線
AUC
計算方式：
AUC爲ROC曲線下的面積，一般AUC在0.5到1之間，AUC越高，模型的區分能力越好。
GINI係數
Gini coefficient用以衡量模型風險區分能力，用來衡量分佈平衡程度，值的範圍爲0~1，計算方式：均勻分佈直線與洛倫茲曲線之間的面積/均勻分佈直線下的面積，即G=A/(A+B)。

計算方式：
gini係數 = A / (A + B) = (AUC - C) / (A + B) = (AUC -0.5) / 0.5 = 2*AUC - 1（其中C=A+B）；
PSI
穩定度指標PSI，用於衡量測試樣本即模型開發樣本評分的分佈差異。PSI表示的就是按分數分檔後，針對不同樣本，或者不同時間的樣本，population分佈是否有變化，就是看各個分數區間內人數佔總人數的佔比是否有顯著變化。
計算方式：
1.獲取各評分區間樣本實際佔比Ac，與預測佔比Ex，
2.PSI=sum((Ac-Ex)*ln(Ac/Ex))

穩定性測試分爲兩塊，一個是樣本外測試，一個是時間外測試；

LIFT
lift用來衡量一個模型是否有效，其值爲應用模型對目標響應的預測能力優於隨機響應的倍數，lift值越大，模型運行效果越好。
計算方式：
Lift=(TP/(TP+FP))/(P/(P+N))
即實際爲壞樣本中預測正確的比例與隨機分配壞樣本的比例的比值。
GAIN
用來描述模型的整體精準度；
計算方式：
Gain=TP/(TP+FP)
參考url：
https://staesthetic.wordpress.com/2014/04/14/gini-roc-auc-and-accuracy/
https://blog.csdn.net/shy19890510/article/details/79501582
https://blog.csdn.net/pipisorry/article/details/52574156
https://zh.wikipedia.org/wiki/基尼係數
 http://www.mamicode.com/info-detail-2307541.html