評分模型target目標變量科學選定方法

原創

python_backup

2021-03-22 18:35

歡迎各位同學學習python信用評分卡建模視頻系列教程（附代碼，博主錄製）：

騰訊課堂報名入口

網易雲課堂報名入口

（微信二維碼掃一掃）

1.最佳使用場景

首先我們需要知道，本文講解的Y變量的定義方法最佳適用於還款方式爲分期貸款(每期還款金額區別不大)的金融產品。如果對於信用卡或者循環貸款等其他還款方式的信貸產品，需要在本方法的基礎上做一些變形，或者直接根據場景進行主觀決定。
打個比方，對於信用卡產品，其每期還款金額不同，如果按照下面講解的方法會發現與分期類產品的數據分析走勢不一致。這個時候可以按照Roll rate table假定出Y後根據場景特點確定出表現期與觀察期，如經驗通識M3+爲壞且表現期、觀察期各限定6個月。
2.兩份核心參照表
整個定Y的過程主要圍繞着兩份核心數據表：Roll rate table 和 Month on book。其中Roll rate table是遷徙率表，觀察的時間顆粒度最好爲每個月的累計資產質量分佈，這裏面需要注意的是累積。

Roll rate table主要目的是假定Y變量，分析上圖示例1可以發現M4->M5的平均遷徙率爲95.37%，預示處於M4逾期狀態的客戶超過95%以上會變成M5逾期狀態，M5之後每個逾期狀態的遷徙率逐步增加直至100%。可以暫時假定本次樣本的目標變量Y爲M3+（即處於M3+逾期狀態的客戶可以認爲壞客戶）。
接下來分析第二份核心數據表-Month on book(MOB)帳齡表。
此時我們通過初步分析Roll rate table假定出Y的壞客戶定義爲M3+，分析M3+的帳齡表，可以進一步製作出Vintage圖。

從上圖示例2和3可以分析發現，若想將壞客戶的成熟度儘可能的表現出來（目的在於我們可以從樣本里捕捉到最多的壞客戶），我們至少需要設定9個月的樣本表現期（即賬期MOB=9）。假定從當下2019年7月開始回推表現期，我們選擇樣本觀察點的時間橫軸右邊界在2018年10月（2019年7月-9個月），即只能從2018年10月及之前開始選擇模型樣本（如下圖4）。

3.動態平衡選擇
雖然通過初步分析可以假定出Y變量M3+爲壞，但是通過表現期回推出建模樣本後，要考察樣本構建模型的基礎，比如最大最小樣本策略。同時也要參照觀察點選定的參考依據，如就近原則、切片特徵取得等實際情況，這些在課程中已經詳細講過就不在本篇過多展開。
假設通過上述方式定義的M3+樣本不符合建模要求，這個時候有兩種優化方式：
1）平衡性選擇合適的帳期，即表現期。2）平衡性選擇合適的Y。
第一種方式的好處是不會重新定義模型目標Y變量，但是爲了縮短表現期而犧牲了壞客戶的成熟度；第二種方式重新定義Y變量的壞處是降低壞客戶精準性和模型評分趨嚴，但好處不僅可以擴大壞客戶樣本量，還能保證壞客戶的成熟度。
在綜合考慮過樣本容量、就近原則等一系列模型樣本篩選維度後，會按照上述兩者方式之一或者結合一起對Y變量二次假定進行平衡選擇，直至找到最優的目標Y變量。
這個動態平衡選擇的過程，仍然會參照兩份核心數據表，假定出Y後選擇表現期，進而確定觀察點，同時考量觀察點區間內的建模樣本是否合格。
以上，就是對於評分模型的目標Y變量科學選定方法的總結，希望可以幫助讀者朋友們。
轉https://mp.weixin.qq.com/s/_ONAt0Tsq5zgQ3pAuEnmsw

歡迎學習更多風控建模相關知識《python金融風控評分卡模型和數據分析微專業課》

騰訊課堂報名入口

網易雲課堂報名入口

（微信二維碼掃一掃）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

評分模型target目標變量科學選定方法

HTML頁面關於高分屏的設置

北歐瑞典挪威芬蘭瑞士TikTok海外網紅與YouTube博主的合作模式

歐洲英國德國法國TikTok與YouTube海外網紅達人的完美合作策略

druid數據源 xml配置

全國行業信用公共服務平臺（企業信用評價查詢）

金融風控評分卡模型的WOE分箱一定要單調嗎？

python實戰因子分析和主成分分析 SVD奇異值分解的基本原理和運用

python實戰因子分析factor analysis

全球新冠肺炎疫苗接種數據分析

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結