邏輯迴歸評分卡分數映射

原創

Labryant

2020-06-21 11:12

本文轉自https://github.com/xsj0609/data_science/tree/master/ScoreCard

一、評分卡邏輯

　信貸業務評估的是客戶的客戶違約率（Percent of Default）即PD，是[0,1]的概率，比如2%即100個客戶中有2個違約，簡稱爲p。

　評分卡中不直接用客戶違約率p，而是用違約概率與正常概率的比值，稱爲Odds，即
$Odds=\frac{p}{1-p}$
$p=\frac{Odds}{1+Odds}$
　評分卡的背後邏輯是Odds的變動與評分變動的映射（把Odds映射爲評分），分值是根據Odds的前提條件算出來的，不是人工取的。以單個客戶在整張評分卡的得分的變動（比如評分從50分上升到70分）來反映Odds的變動（比如Odds從5%下降至1.25%），以及背後相對應的客戶違約率PD的變動（比如從4.8%下降到1.2%）。違約率PD不直觀、業務看起來不方便、不便計算，而評分就很直觀、便於計算。如圖所示。

二、評分映射公式

　Odds映射爲評分的公式爲：
$Score=A-Blog(\frac{p}{1-p})$
<1> 預設條件
　要算出係數A、B的話，需要從業務角度先預設兩個前提條件：

在某個特定的比率 $θ_0$ 設定特定的預期分值 $P_0$
指定比率翻番時分數的變動值（PDO）

解釋：

比如根據業務經驗，消費金融信貸的客戶違約率4.8%算正常（ $θ_0$ =Odds=5）。預設評分卡的分值爲0-100分，那取預期分值 $P_0$ 爲50分，並指定當Odds按雙倍上下浮動時（比如2.5%或10%），分值則對應上下變動10分（比如60分或40分）。

這裏=5%是根據業務經驗來的，沒有數學依據；

0-100分是根據做評分卡的需要來的，沒有數學依據。要是想做成600-1000分的評分卡也可以，修改對應的 $P_0$ 和PDO就行；

$P_0$ =50分是根據0-100分來的，也可以取45分或73分，不重要。重要的是隨着Odds翻番變動時，分數也隨之變動的聯動變化體系（你翻番我就變PDO=10分）

<2> 求解A、B
　設定好 $θ_0$ 、 $P_0$ 、PDO後，聯動變化爲：Odds( $θ_0$ )對應的分值爲 $P_0$ ，且翻番的Odds( $2θ_0$ )對應的分值爲 $P_0$ +PDO。則有以下兩式：
$P_0=A-Blog(θ_0)$
$P_0+PDO=A-Blog(2θ_0)$
解出A、B爲：
$B=\frac{PDO}{log(2)}$
$A=P_0+Blog(θ_0)$

按上面的解釋舉個例子：
設θ_0、P_0、PDO爲5%、50分、10分，則
$B=\frac{10}{ln(2)}=14.43$
$A=50+14.43*ln(0.05)=6.78$
則
$Score=6.78-14.43*log(\frac{p}{1-p})$
<3> 完整的對應關係表
　按照公式，可以把所有Odds（ $\frac{p}{1-p}$ ）和客戶評分、客戶違約概率（PD）的對應關係算出來

　該關係對應表應該算信用評分卡的核心思想了，評分是外層表現，客戶違約率是內層核心，Odds是中間層轉換計算

三、Odds映射X變量

$log(\frac{p}{1-p})=β_0+β_1x_1+β_2x_2+...++β_nx_n$

即
$p=\frac{1}{1+e^-β^Tx}$
　這樣就可以根據變量x和係數的的值計算出違約概率p了。

四、X變量細分到分組

　我們要做的是分組評分卡，X是要對應到每個分組，得到各變量分組的評分然後相加得到客戶總評分的，那就還需要將X打散到各分類（用離散型數據入邏輯迴歸模型）。因此這裏的輸入X就不能是原始變量，而是原始變量分箱並算WOE後的woe值（類似離散變量中各類別的數值化），即：
$Score=A-B[β_0+β_1(δ_{11}w_{11}+δ_{12}w_{12}+δ_{13}w_{13})+β_2(δ_{21}w_{21}+δ_{22}w_{22}+δ_{23}w_{23}+δ_{24}w_{24})+...+β_n(δ_{n1}w_{n1}+δ_{n2}w_{n2}]$
　假設類別型變量 $x_1$ 、 $x_2$ 、 $x_3$ 分別有3、4、2個分類（數值型變量先分箱成類別型變量） $δ_{ij}$ 代表第i個變量的第j個分類，客戶數據參與評分時，某個變量x只會有1個數，只會對應一個分類。比如，變量 $x_1$ 的取值是第2個分類的話，那 $δ_{12}$ 爲1，則第二個分類的woe $w_12$ 值生效， $x_1$ 的其他兩個 $δ$ 則爲0，對應的其他兩個分類的woe值無效不參與計算。

五、生成評分卡

　將上面的公式變下形式，變成最終可以組成評分卡的樣式

　A、B已經算出， $β$ 是邏輯迴歸模型的輸出係數， $β_0$ 是邏輯迴歸模型的輸出截距項，w是分箱後的woe值。至此評分卡就可以生成了。

【作者】：Labryant
【原創公衆號】：風控獵人
【簡介】：某創業公司策略分析師，積極上進，努力提升。乾坤未定，你我都是黑馬。
【轉載說明】：轉載請說明出處，謝謝合作！~

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

邏輯迴歸評分卡分數映射

一、評分卡邏輯

二、評分映射公式

三、Odds映射X變量

四、X變量細分到分組

五、生成評分卡

如何使用 JS 判斷用戶是否處於活躍狀態

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

風控分析常用指標介紹

額度策略

scorecardpy庫的使用簡介

特徵工程（下）

數據挖掘比賽模板

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結