(八)行爲評分卡模型(B卡)的介紹

(八)行爲評分卡模型(B卡)的介紹

在信貸業務中,評分卡分爲三種:

  • 申請評分卡(A卡)
  • 行爲評分卡(B卡)
  • 催收評分卡(C卡)

本篇我們來學習一下行爲評分卡(B卡),首先什麼是行爲評分卡呢,行爲評分卡的使用場景以及目的,適用的信貸產品?

其中特別注意一下,不適合先息後本的信貸產品,因爲每個月的違約概率不一樣,不好預測

 

觀察期和表現期

學習行爲評分卡之前,要了解一些概念,什麼是觀察期和表現期,什麼是觀察點

觀察期觀察的是行爲,表現期預測表現好壞

P(表現期好壞/觀察期行爲)

這裏要注意一下,假如我們定義表現壞客戶爲M3+,觀察期時間窗口爲12個月,則起碼要收集12+3個月的數據

當然觀察點也不宜太長,因爲不到MOB的客戶,不能進入行爲評分卡中,會丟失大量重要數據

當此刻的時間滿足了MOB但是不滿足觀察期,也可以構建B卡,但是有一些變量表現效果不怎麼好(因爲和每個變量的收集間隔有關,間隔長的變量收集得太少,表現自然不佳)

 

講完了觀察期和表現期,我們就來講一下信用評分卡常用的特徵構造,特徵構造之前我們來學習一個定義:時間切片

時間切片

特徵構造

一般有以下幾類特徵

  • 還款率類型的特徵

  • 額度使用率類型的特徵

  • 逾期類型的特徵

這裏注意一下,不能用輕度逾期去預測輕度逾期,不能用重度逾期去預測重度逾期,這裏的目標變量是DPD(day past due)90,變量可以是DPD60、DPD30等

  • 消費類型的特徵(每一筆消費有具體詳細可以做)

  • 三方機構(社交數據、出行數據)

 

下面就來講解一下行爲評分卡建立模型的步驟(和申請評分卡差不多)

  • 數據預處理
  • 特徵衍生

  • 特徵處理與篩選

  • 變量分箱
  • 模型的參數估計(邏輯迴歸模型)

  • 特徵挑選

邏輯迴歸要求係數爲負而且P值要顯著,我們使用外生模型GBDT估計模型重要性

也就是挑選4個GBDT模型最重要的變量進行邏輯迴歸後,發現其邏輯迴歸係數爲負,之後我們按照GBDT模型變量重要性降序順序一個一個往裏面加,每加一個,進行一次邏輯迴歸,發現存在邏輯迴歸係數爲正的,就可以把該變量剔除

添加完所有變量後,邏輯迴歸結果如下圖所示,還是存在P值不顯著情況,單獨拿去這些變量一個一個與目標變量進行邏輯迴歸檢驗其顯著性

所以,我們使用LASSO再次進行變量挑選

  • 模型的性能測試

  • 概率轉換爲分數

 

代碼詳細請關注我的下一篇博客哦,喜歡的小夥伴可以點個贊

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章