WOE和IV使用來衡量變量的預測能力,值越大,表示此變量的預測能力越強。
WOE=ln(累計正樣本佔比/累計壞樣本佔比0)
IV=(累計正樣本佔比-累計壞樣本佔比)*WOE
信息值(IV) | 預測能力 |
<0.03 | 無預測能力 |
0.03~0.09 | 低 |
0.1~0.29 | 中 |
0.3~0.49 | 高 |
0.5~ | 極高 |
KS和GINI係數用來衡量數據對好壞樣本的區分能力
KS 值,累計客戶分佈百分比,由小到大排列,兩者之間的最大差距值即爲KS值,其值越大表示模型的區分能力越強。
K-S值 | 解釋能力 |
<0.20 | No |
0.21 ~0.40 | 低 |
0.41~0.50 | 中 |
0.51~0.60 | 高 |
0.61~0.75 | 極高 |
>0.9 | 太高,可能有問題 |
GINI係數
分別以縱軸及橫軸表示分數由高至低及好壞客戶的累積百分比,用以顯示各分數下好壞客戶的累積差異。
基尼係數 | 解釋能力 |
0 | NO |
0~0.4 | 低 |
0.4~0.6 | 中 |
0.6~0.8 | 高 |
>0.8 | 極高 |