信貸風控中Vintage、滾動率、遷移率的理解

風控業務背景

信貸風險管理是一門藝術,更是一門科學。資產質量分析中常會涉及到三個理論:

  • 賬齡分析(Vintage Analysis):用以分析賬戶成熟期、變化規律等。
  • 滾動率分析(Roll Rate Analysis):用以定義賬戶好壞程度。
  • 遷移率分析(Flow Rate Analysis):用以分析不同逾期狀態之間的轉化率。

本文吸收了一些前人的優秀成果,力求系統介紹這三者的概念、計算邏輯和業務應用,希望能對大家有所幫助。

目錄
Part 1. 基礎風控指標概念
Part 2. Vintage Analysis
Part 3. Roll Rate Analysis
Part 4. 如何確定目標變量Y
Part 5. Flow Rate Analysis
Part 6. 壞賬準備金的計算
Part 7. 總結
致謝
版權聲明
參考資料

Part 1. 基礎風控指標概念

爲了更容易理解後續內容,我們先介紹一些基礎的風控指標概念。

定義一:賬齡(Month of Book,MOB)

資產放款月份。類似於嬰孩一出生就有了年齡,一旦申貸訂單被放款,也便擁有了賬齡和生命週期。

  • MOB0:放款日至當月月底
  • MOB1:放款後第二個完整的月份
  • MOB2:放款後第三個完整的月份

MOB的最大值取決於信貸產品期限。如果是12期產品,那麼該資產的生命週期是12期,MOB最大到MOB12。

例如,2019年11月13日放款的訂單,2019年11月是MOB0,2019年12月是MOB1,以此類推。

定義二:逾期天數(Days Past Due,DPD)

逾期天數 = 實際還款日 - 應還款日。

DPDN+表示逾期天數 >= N天,如DPD30+表逾期天數 >=30天的資產

例如,若還款日是每月8號,那麼9號就是逾期第一天。如果客戶在10號還款,那麼逾期2天。

定義三:逾期期數(M)

實際還款日與應壞款日之間的逾期天數,並按區間劃分後的逾期狀態。M取自Month on Book的第一個單詞。(注:不同機構所定義的區間劃分可能存在差異)

  • M0:當前未逾期(或用C表示,取自Current)
  • M1: 逾期1-30日
  • M2:逾期31-60日
  • M3:逾期61-90日
  • M4:逾期91-120日
  • M5:逾期121-150日
  • M6:逾期151-180日
  • M7:逾期180日以上。此時也被稱爲呆賬(Bad Debts),會予以註銷賬戶(write-off)

Part 2. Vintage Analysis

Vintage一詞最初來源於葡萄酒業 。由於每年採摘的葡萄會受到日照、氣溫、降水等因素的影響,最終釀造的葡萄酒品質會存在差異。在窖藏一定年份後,葡萄酒的品質將趨於穩定,也就是品質成熟,這段年份數被稱爲成熟期(maturity)。

簡便起見,我們以酒精濃度作爲衡量葡萄酒品質的標準,約定:濃度越高,品質越好。首先,記錄入窖年份作爲該批次葡萄酒的標籤,這也被稱爲Vintage或者Cohort。之後,我們將每年定期抽樣測量酒精濃度,保存記錄數據,如圖1所示。

經過幾年的數據積累,我們就可以繪製出酒精濃度隨時間變化的Vintage曲線。俗話說,酒越釀越醇,Vintage曲線通常是單調遞增的,如圖1所示。

圖 1 - 葡萄酒的Vintage曲線

我們可以利用Vintage曲線做什麼呢?如圖2所示,主要用途包括:

  1. 分析變化規律:評估不同年份的葡萄酒的品質隨着窖藏時間推移的變化規律。某些年份的葡萄酒濃度在入窖第1年就能達到較高的水平,但上升緩慢;有些起點低,但上升快 。
  2. 確定最終品質:Vintage曲線最終穩定值,表明了這批葡萄酒的最終酒精濃度 。
  3. 確定成熟期:由圖1可知,在入窖第6年後,酒精濃度穩定不變,可以確定成熟期是6年,我們最早在第6年就可以開桶品嚐 。
  4. 分析影響因素:根據Vintage曲線特徵,我們可以分析某個年份的葡萄所受到的環境影響因素,從而改善生產工藝。比如,由於某一年的光照不充分,糖分積累少,酒精濃度可能最終就比較低。我們就可以人工增加光照強度 。

圖 2 - 葡萄酒的Vintage分析

在信貸領域中,我們也可以用Vintage曲線分析資產(portfolio)質量的成熟過程變化規律。爲更容易理解,在此列舉了Vintage分析過程中兩個領域的對應關係,如圖3所示。

圖 3 - 葡萄酒和信貸行業的Vintage對比

遵循同樣的分析思路,按賬齡(MOB)長短對齊後比較,我們可以瞭解同一產品不同時期放款的資產質量。

  1. 確定資產質量:一般以逾期率來定義資產質量,也就是曲線平緩後對應的逾期率。
  2. 分析變化規律:資產質量(例如逾期率指標)的變化情況,如果前幾期逾期率上升很快,那麼說明短期風險沒有捕捉住,欺詐風險較高;反之,如果曲線一直在上升,說明信用風險識別能力不佳。
  3. 確定賬戶成熟期:用來判斷客戶展現好壞的時間因素,從而幫助定義表現期。
  4. 分析影響因素:風控策略收緊或放鬆、客羣變化、市場環境、政策法規等都會影響資產質量。分析影響因素,可以用來指導風控策略的調整。

求知的你肯定會疑惑,如果以逾期率來定義資產質量,那麼逾期風險(目標變量Y)是如何定義的?如何確定M3,還是M6? 稍安勿躁,後續將會結合滾動率分析來揭曉謎底。

首先,我們來分析爲什麼要確定賬戶的表現期?在《風控特徵—時間滑窗統計特徵體系》一文中,我們提到過:

表現期越長,信用風險暴露將越徹底,但意味着觀察期離當前越遠,用以提取樣本特徵的歷史數據將越陳舊,建模樣本和未來樣本的差異也越大。反之,表現期越短,風險還未暴露完全,但好處是能用到更近的樣本。

圖 4 - 觀察點、觀察期與表現期

例如,對於一個12期分期還款的信貸產品,理論上當用戶在12期結束,並還清所有的錢後,我們才能定義爲絕對的好客戶;反之,我們只能說到目前爲止是一個好客戶,但並不能知道未來幾期用戶會不會逾期不還錢。

因此,我們需要確定一個合適的表現期能覆蓋足夠多的壞客戶即可。

圖 5 - 某12期信貸產品2018年的Vintage曲線

根據圖5的信貸產品Vintage曲線,我們可以得到哪些信息呢?

  1. 賬齡最長爲12個月,代表產品期限爲12期。隨着12期結束,賬戶的生命週期走到盡頭。
  2. 根據2018年5月放貸的訂單完全走完賬齡生命週期,而2018年6月卻沒走完,說明數據統計時間爲2019年6月初
  3. 賬齡MOB1、MOB2、MOB3的逾期率都爲0,說明逾期指標爲M4+(逾期超過90天)風險。
  4. 由放貸月份從2018年1月~12月的賬戶的最終逾期率都在降低,說明資產質量在不斷提升,可能是因爲風控水平在不斷提升。
  5. 2018年5月相對於2018年1~4月的逾期率大幅度下降,說明該階段風控策略提升明顯。
  6. 不同月份放款的M4+在經過9個MOB後開始趨於穩定,說明賬戶成熟期是9個月

繪製Vintage曲線時,就不得不提到縱座標中逾期率的定義。通常有兩種計算口徑:

  • 第一種,訂單口徑,逾期率 = 逾期訂單數 / 總放貸訂單數
  • 第二種,金額口徑,逾期率 = 逾期金額 / 總放貸金額

目前互聯網金融各家機構的口徑定義存在差異,因此僅僅根據各家發佈的Vintage曲線,有時並不能客觀分析資產質量和風控水平。

Part 3. Roll Rate Analysis

滾動率分析就是從某個觀察點之前的一段時間(觀察期)最壞的狀態,向觀察點之後的一段時間(表現期)最壞的狀態的發展變化情況,如圖6所示。

⚠️注意:一般大家也習慣把vintage中的成熟期叫做表現期,因此出現一定的混淆。但意思是都是未來的一段時間窗。

圖 6 - 客戶逾期狀態轉化

滾動率分析的具體操作步驟爲:

  • step 1. 確定數據源。一般利用客戶還款計劃表(repayment schedule)。
  • step 2. 選擇觀察點,以觀察點爲截止時間,統計客戶在觀察期(如過去6個月)的最長逾期期數,按最壞逾期狀態將用戶分爲幾個層次,如C、M1、M2、M3、M4+。
  • step 3. 以觀察點爲起始時間,統計客戶在表現期(如未來6個月)的最長逾期期數,按最壞逾期狀態將用戶分爲幾個層次,如C、M1、M2、M3、M4+。
  • step 4. 交叉統計每個格子裏的客戶數,如圖6中表1所示。
  • step 5. 統計每個格子裏的客戶佔比,如圖6中表2所示。
  • step 6. 爲了排除觀察點選擇時的隨機影響,一般會選擇多個觀察點。重複step1 ~5。

例如,選擇觀察點爲2018年6月30日,我們取10,000個客戶作爲研究對象,統計該10,000個客戶從觀察期到表現期的最大逾期狀態的變化情況,如圖7所示。

圖 7 - 滾動率分析矩陣

觀察圖7,我們可以發現以下規律:

  1. 逾期狀態爲M0的客戶,在未來6個月裏,有96%會繼續保持正常狀態,4%會惡化爲M1和M2;
  2. 逾期狀態爲M1的客戶,未來有81%會回到正常狀態,即從良率爲81%,有7%會惡化,13%會保持M1狀態;
  3. 逾期狀態爲M2的客戶,從良率爲23%,有39%會惡化爲M3和M4+;
  4. 逾期狀態爲M3的客戶,從良率爲14.7%,有60.7%會惡化爲M4+;
  5. 逾期狀態爲M4+的客戶,從良率僅爲4%,有80%會繼續保持此狀態。

因此,我們認爲歷史逾期狀態爲M4+的客戶已經壞透了,幾乎不會從良。爲了讓風控模型有更好的區分能力,需要將客戶好壞界限儘可能清晰,可以定義:

壞用戶(bad)= 逾期狀態爲M4+(逾期超過90天)

Part 4. 如何確定目標變量Y

在風控建模中,由於是有監督學習,我們非常關心如何定義合適的目標變量Y?這就需要結合滾動率分析和Vintage分析,兩者的分工在於:

  • 滾動率分析用於定義客戶的好壞程度
  • Vintage分析用於確定合適的表現期

定義目標變量Y的具體操作步驟爲:

  • step 1. 利用滾動率分析定義壞客戶,例如上文案例中定義:M4+爲壞客戶
  • step 2. 以M4+作爲資產質量指標,統計Vintage數據表,繪製Vintage曲線。目的是分析賬戶成熟期,例如上文案例確定:賬戶成熟期是9個月。

你可能還是會比較疑惑,爲什麼還需要通過Vintage分析來確定表現期?

這是因爲:雖然滾動率分析確定了M4+作爲壞的程度,但是對於12期的產品,有些賬戶是在前4期MOB(也就是MOB1 ~ MOB4,經過4個表現期)就達到M4+,有些是在後幾期才達到M4+。

對於這個Vintage裏所有的賬戶,我們的目的是抓住儘可能多的壞客戶。

現在進一步補充Vintage曲線的繪製過程:如圖8所示,對於這10,000個賬戶,以MOB1爲起點,把前N個MOB作爲一個窗口,滑窗統計壞客戶率,得到圖5-表1中的Vintage數據,並繪製Vintage曲線。我們可以發現:經過9期,我們幾乎能夠抓住所有的壞客戶。

圖 8 - 不同客戶的逾期狀態(紅=逾期,綠=正常)

因此,我們將兩者結合起來,定義:

  • Bad = 賬戶經過9期表現期後,逾期狀態爲M4+(逾期超過90天)。此時 [公式] 。
  • Good = 經過9期表現期,但未達到M4+逾期狀態。此時 [公式] 。
  • Intermediate = 未進入9期表現期,賬戶還未成熟,無法定義好壞,也就是不定樣本。

Part 5. Flow Rate Analysis

遷移率分析法(Flow Rate)也叫做淨流量滾動比例法(Net Flow Rate),能形象展示客戶貸款賬戶在整個生命週期中的變化軌跡,也是預測未來壞賬損失的最常用的方法。

核心假設爲:處於某一逾期狀態(如M2)的賬戶,一個月後,要麼從良爲M0賬戶,要麼惡化爲更壞的下一個逾期狀態(如M3)。

遷移率 = 前一期逾期金額到下一期逾期金額的轉化率

一般縮寫爲M0-M1、M4-M5等形式,例如:

  • M0-M1 = 當月進入M1的貸款餘額 / 上月末M0的貸款餘額
  • M2-M3 = 當月進入M3的貸款餘額 / 上月末M2的貸款餘額

遷移率分析的具體操作步驟爲:

  • step 1. 定義逾期狀態,如前文所述的M0、M1、M2等。
  • step 2. 計算各逾期狀態之間的遷移率,如M0-M1、M2-M3等。
  • step 3. 計算不同月份(也可稱爲Vintage)的平均遷移率。目的是對本平臺在不同時期的資產的遷移率有整體的認知。
  • step 4. 根據平均遷移率和不良資產回收率,計算淨壞賬損失率。

接下來,我們以數值案例(非真實業務數據)展示上述過程。

圖 9 - 遷移率分析

圖9-表2中,2月份的逾期M1資產只能從1月份的正常M0資產滾動而來,因此從逾期M0資產向M1的轉化率爲 [公式] 。

以此類推,我們可以計算所有月份的資產惡化率。黃色部分爲不良資產的惡化遷移路徑,其計算口徑爲:

  • 截止1月末,正常M0資產爲 [公式] 元,這是起點。
  • 截止2月末,1月末的正常M0資產中有 [公式] 惡化爲逾期M1資產。
  • 截止3月末,2月末的逾期M1資產中有 [公式] 惡化爲逾期M2資產。
  • 截止4月末,3月末的逾期M2資產中有 [公式] 惡化爲逾期M3資產。
  • 截止5月末,4月末的逾期M4資產中有 [公式] 惡化爲逾期M5資產。此時已過催收黃金期(90天以內)。
  • 截止6月末,5月末的逾期M5資產中有 [公式] 惡化爲逾期M6資產。這可能採用了委外催收、司法手段等催收策略,效果顯著。
  • 截止7月末,6月末的逾期M5資產中有 [公式] 惡化爲逾期M7資產。此時將視爲不良資產,打包轉賣給第三方公司,這樣就能回收部分不良資產,減少損失。

通過遷移率,我們可以清晰觀察到每個Vintage的資產在各逾期狀態的演變規律。

圖9-表2中,我們從橫向比較每個月的遷移率,發現不完全一樣。這是因爲隨着時間推移、外在宏觀經濟環境、內部政策等變化而產生一定的波動。我們可以利用這些數據:

  1. 觀察遷移率的發展軌跡,監控壞賬的發展傾向和催收效果。
  2. 通過對多個月份的遷移率計算平均值,從而使遷移率更加穩定。

Part 6. 壞賬準備金的計算

呆帳風險是信貸機構必須面對的風險,主要來源於信用風險和欺詐風險等。爲了應對未來呆帳的可能,信貸機構一般都會設定一個儲備資金,這就是壞賬準備金(Bad Debt Reserve)。那麼我們該如何計算壞賬準備金?

一般做法是,把未清償貸款餘額乘以一定的準備金比例(Reserve Ratio)所得。可以理解,資產逾期等級越高(越差),準備金比例也應該越高,因爲惡化爲呆帳的可能性也更高。如圖10所示,正常M0資產惡化爲呆帳的可能性最低,因此我們預留的準備金比例也就最少。

我們總結下計算壞賬準備金的步驟爲:

  • step 1. 統計未清償貸款金額的分佈,也就是M0~M6狀態分別對應的資產餘額。
  • step 2. 爲每個逾期狀態的資產分配一個準備金比例。
  • step 3. 每個子項目的準備金金額 = 未清償貸款餘額 x 準備金比例。
  • step 4. 每個子項目的準備金金額相加,得到最終的準備金。

圖 10 - 壞賬準備金計算示例

你或許會問,這裏最關鍵的準備金比例是如何給出的?

由於壞賬準備金是用來覆蓋預期的未來呆帳損失的,準備金比例必須等於處於各個逾期狀態的資產未來演變爲呆帳的比例

回到遷移率分析中,我們發現從正常M0資產遷移至逾期M7資產(呆帳)需經過7次遷移,如圖11所示。那麼,我們只要把各個狀態之間的轉化率相乘,不就得到準備金比例了?

圖 11 - 各逾期狀態的遷移率和毛壞賬率計算

因此,我們定義正常M0資產對應的毛壞賬損失率,也就是遷移到呆帳的轉化率爲

毛壞賬損失率 = [公式]

在本案例中,正常M0資產對應的毛壞賬損失率爲:

[公式]

在實際中,信貸機構會將不良資產打包轉賣給第三方公司,這樣就能回收部分不良資產,減少損失。因此,我們定義淨壞賬損失率爲:

淨壞賬損失率 = 毛壞賬損失率 - 不良資產外賣回收率

由於M7不良資產的平均回收率爲 [公式] ,則可計算淨壞賬損失率爲:

[公式]

同理,我們可以計算正常資產到不同逾期狀態資產的毛損失率和淨損失率如下:

圖 12 - 毛損失率和淨損失率

根據圖12所示的損失率表,我們定義:

  • 當月應計撥備額 = SUM(淨壞賬損失率 * 月末應收賬款餘額)
  • 撥備率 = 當月應計撥備額 / 總資產金額

其中,撥備率是用來預防不良資產的發生而準備的金額的比例。撥備率應越低越好。撥備率越高說明風險越大,損失越大,利潤越小。

圖 13 - 2018年7月的資產預計期望損失計算

在本案例中,當月應計撥備額爲65421元,如圖13所示。撥備率爲:[公式]

Part 7. 總結

本文所整理的主要知識點包括:

  1. Vintage、滾動率、遷移率的概念和區別。
  2. 如何根據數據分析來確定風控建模中的好壞定義。
  3. 撥備率的概念,以及如何根據遷移率來計算撥備率。

致謝

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章