本文轉自https://github.com/xsj0609/data_science/tree/master/ScoreCard
一、評分卡邏輯
信貸業務評估的是客戶的客戶違約率(Percent of Default)即PD,是[0,1]的概率,比如2%即100個客戶中有2個違約,簡稱爲p。
評分卡中不直接用客戶違約率p,而是用違約概率與正常概率的比值,稱爲Odds,即
評分卡的背後邏輯是Odds的變動與評分變動的映射(把Odds映射爲評分),分值是根據Odds的前提條件算出來的,不是人工取的。以單個客戶在整張評分卡的得分的變動(比如評分從50分上升到70分)來反映Odds的變動(比如Odds從5%下降至1.25%),以及背後相對應的客戶違約率PD的變動(比如從4.8%下降到1.2%)。違約率PD不直觀、業務看起來不方便、不便計算,而評分就很直觀、便於計算。如圖所示。
二、評分映射公式
Odds映射爲評分的公式爲:
<1> 預設條件
要算出係數A、B的話,需要從業務角度先預設兩個前提條件:
- 在某個特定的比率設定特定的預期分值
- 指定比率翻番時分數的變動值(PDO)
解釋:
- 比如根據業務經驗,消費金融信貸的客戶違約率4.8%算正常(=Odds=5)。預設評分卡的分值爲0-100分,那取預期分值爲50分,並指定當Odds按雙倍上下浮動時(比如2.5%或10%),分值則對應上下變動10分(比如60分或40分)。
- 這裏=5%是根據業務經驗來的,沒有數學依據;
- 0-100分是根據做評分卡的需要來的,沒有數學依據。要是想做成600-1000分的評分卡也可以,修改對應的和PDO就行;
- =50分是根據0-100分來的,也可以取45分或73分,不重要。重要的是隨着Odds翻番變動時,分數也隨之變動的聯動變化體系(你翻番我就變PDO=10分)
<2> 求解A、B
設定好、、PDO後,聯動變化爲:Odds()對應的分值爲,且翻番的Odds()對應的分值爲+PDO。則有以下兩式:
解出A、B爲:
按上面的解釋舉個例子:
設θ_0、P_0、PDO爲5%、50分、10分,則
則
<3> 完整的對應關係表
按照公式,可以把所有Odds()和客戶評分、客戶違約概率(PD)的對應關係算出來
該關係對應表應該算信用評分卡的核心思想了,評分是外層表現,客戶違約率是內層核心,Odds是中間層轉換計算
三、Odds映射X變量
即
這樣就可以根據變量x和係數的的值計算出違約概率p了。
四、X變量細分到分組
我們要做的是分組評分卡,X是要對應到每個分組,得到各變量分組的評分然後相加得到客戶總評分的,那就還需要將X打散到各分類(用離散型數據入邏輯迴歸模型)。因此這裏的輸入X就不能是原始變量,而是原始變量分箱並算WOE後的woe值(類似離散變量中各類別的數值化),即:
假設類別型變量、、分別有3、4、2個分類(數值型變量先分箱成類別型變量) 代表第i個變量的第j個分類,客戶數據參與評分時,某個變量x只會有1個數,只會對應一個分類。比如,變量的取值是第2個分類的話,那爲1,則第二個分類的woe值生效,的其他兩個則爲0,對應的其他兩個分類的woe值無效不參與計算。
五、生成評分卡
將上面的公式變下形式,變成最終可以組成評分卡的樣式
A、B已經算出,是邏輯迴歸模型的輸出係數,是邏輯迴歸模型的輸出截距項,w是分箱後的woe值。至此評分卡就可以生成了。
【作者】:Labryant
【原創公衆號】:風控獵人
【簡介】:某創業公司策略分析師,積極上進,努力提升。乾坤未定,你我都是黑馬。
【轉載說明】:轉載請說明出處,謝謝合作!~