信用評分模型是消費信貸管理中先進的技術手段,是現在金融行業常用的信用風險評估方法,本文從宏觀上介紹評分模型的建模開發流程。
1. 明確問題
明確業務要解決的問題,確定時間窗口、標籤的定義規則,以及模型的評價指標和數據來源。
在定義標籤的時候需要注意:
- 要考慮到表現期的長短(有關表現期的定義可以參考觀察期與表現期)
- 要考慮到期終表現與期中表現
- 要考慮到某些羣體的不可確定性(假設3期以上爲壞客戶,如果有拖欠2期的,如果歸爲壞,這些賬戶在最終會還清欠款而回歸好客戶;如果定義爲好客戶,相當一部分會拖欠越來越嚴重成爲壞賬;考慮到它的兩面性,可歸類爲‘不確定’,排除在模型樣本之外)
- ‘壞’客戶的定義必須簡明,避免壞客戶出現較大的不同質性
2. 數據獲取
金融行業在多年的經營活動中積累了非常龐大的數據,在建立信用評分模型時往往不會使用全部的數據,因此就涉及到抽樣。
抽樣
- 隨機抽樣
- 分層抽樣
建模樣本要求
- 樣本具有代表性:即樣本能夠代表過去和未來的總體
- 樣本的充分性:總樣本數量和各個類別中的樣本數量充足
- 樣本的時效性:觀察期越近越好,要根據觀察期和表現期長短及樣本數量來定
- 樣本的排除性:明確規定排除在業務範圍內的客戶不允許用來建模
- 表現推測性:申請風險評分模型的特殊問題,申請評分卡的建模樣本必須包含歷史上被拒絕的申請人和獲得准入但是未激活卡的申請人。
3. 數據清洗
- 數據的描述性統計(單變量統計:均值、方差、衆數、四分位數,偏度,峯度,最大值,最小值等)
- 變量的分佈和檢驗正態假設
- 離羣值的檢測和處理
- 缺失值的處理
- 變量的相關性分析(皮爾遜相關係數、斯皮爾曼相關係數、基尼方差等)
4. 特徵提取和選擇
特徵決定了機器學習的上限,而模型和算法只是逼近這個上限。好的特徵具有明確的業務含義,且能有限的區分好壞客戶。對於信用評分模型,構建特徵時除了客戶的歷史信用狀況外,還需要考慮到客戶的還款能力和還款意願等因素。
5. 模型的制定
(1)分析單變量的預測能力
以學歷爲例,統計不同學歷的客戶中壞賬的比率如下(數據虛構,純屬爲了解釋說明)
學歷 | 總賬戶數 | 好賬戶數 | 壞賬戶數 | 壞賬戶佔比 |
---|---|---|---|---|
小學及以下 | 2000 | 1720 | 280 | 14% |
初中 | 3000 | 2700 | 300 | 10% |
高中 | 3500 | 3220 | 280 | 8% |
專科 | 3200 | 2992 | 208 | 6.5% |
本科 | 4000 | 3800 | 200 | 5% |
碩士 | 2800 | 2716 | 84 | 3% |
博士 | 1500 | 1470 | 30 | 2% |
隨着學歷的提高,壞賬率逐步降低,可以說明這個變量能有效的分辨好壞客戶,其預測能力強;如果反過來,各個欄位的壞賬率大體相同,或無規律可循,則說明沒有多少預測能力,可以剔除。
(2)特徵選擇
各種機器學習的工具包中提供了豐富的接口可供使用進行特徵的選擇,本文不再闡述。除了從算法層面選擇特徵外,還要主要入選特徵的合法和合理性,以及可解釋性和可實施性。
(3)建模
Logistic Regression(邏輯斯蒂迴歸)算法因爲其簡單且可解釋性強,通常被作爲評分卡模型的首選。關於Logistic Regression原理,網上有大量文章講解,本文不再闡述。
6. 模型評估
在模型的開發階段,模型的評估通常採用交叉驗證的方式。
常用的評估指標有:
- ROC曲線
- KS指標
- 區分度
- 擬合度曲線
- 混淆矩陣
7. 實施和監控
當完成評分模型開發,並且模型效果不錯後,就要準備在風控策略上實施評分模型。在實施前需要解決一些問題。例如:評分卡的決策點的分值如何設定?是否加入人工干預等。
在評分模型實施後,還要進行跟蹤和監控,這時需要根據評分卡在實際業務中的表現,製作實施前報告和實施後報告,並根據客戶羣體和市場的變化評估模型的穩定性,不定期調整模型。