(八)行爲評分卡模型(B卡)的介紹
在信貸業務中,評分卡分爲三種:
- 申請評分卡(A卡)
- 行爲評分卡(B卡)
- 催收評分卡(C卡)
本篇我們來學習一下行爲評分卡(B卡),首先什麼是行爲評分卡呢,行爲評分卡的使用場景以及目的,適用的信貸產品?
其中特別注意一下,不適合先息後本的信貸產品,因爲每個月的違約概率不一樣,不好預測
觀察期和表現期
學習行爲評分卡之前,要了解一些概念,什麼是觀察期和表現期,什麼是觀察點
觀察期觀察的是行爲,表現期預測表現好壞
P(表現期好壞/觀察期行爲)
這裏要注意一下,假如我們定義表現壞客戶爲M3+,觀察期時間窗口爲12個月,則起碼要收集12+3個月的數據
當然觀察點也不宜太長,因爲不到MOB的客戶,不能進入行爲評分卡中,會丟失大量重要數據
當此刻的時間滿足了MOB但是不滿足觀察期,也可以構建B卡,但是有一些變量表現效果不怎麼好(因爲和每個變量的收集間隔有關,間隔長的變量收集得太少,表現自然不佳)
講完了觀察期和表現期,我們就來講一下信用評分卡常用的特徵構造,特徵構造之前我們來學習一個定義:時間切片
時間切片
特徵構造
一般有以下幾類特徵
- 還款率類型的特徵
- 額度使用率類型的特徵
- 逾期類型的特徵
這裏注意一下,不能用輕度逾期去預測輕度逾期,不能用重度逾期去預測重度逾期,這裏的目標變量是DPD(day past due)90,變量可以是DPD60、DPD30等
- 消費類型的特徵(每一筆消費有具體詳細可以做)
- 三方機構(社交數據、出行數據)
下面就來講解一下行爲評分卡建立模型的步驟(和申請評分卡差不多)
- 數據預處理
- 特徵衍生
- 特徵處理與篩選
- 變量分箱
- 模型的參數估計(邏輯迴歸模型)
- 特徵挑選
邏輯迴歸要求係數爲負而且P值要顯著,我們使用外生模型GBDT估計模型重要性
也就是挑選4個GBDT模型最重要的變量進行邏輯迴歸後,發現其邏輯迴歸係數爲負,之後我們按照GBDT模型變量重要性降序順序一個一個往裏面加,每加一個,進行一次邏輯迴歸,發現存在邏輯迴歸係數爲正的,就可以把該變量剔除
添加完所有變量後,邏輯迴歸結果如下圖所示,還是存在P值不顯著情況,單獨拿去這些變量一個一個與目標變量進行邏輯迴歸檢驗其顯著性
所以,我們使用LASSO再次進行變量挑選
- 模型的性能測試
- 概率轉換爲分數
代碼詳細請關注我的下一篇博客哦,喜歡的小夥伴可以點個贊