如何“謹慎”使用“數據驅動”的風控模型(二)——決策篇

上一篇,筆者介紹了謹慎使用“數據驅動”的風控模型,需要“高質量的數據 + 審慎嚴謹的決策模型 + 實時全面的監控分析”動態閉環。本篇筆者會着力於介紹整個風控決策體系的建設及持續優化。

風控決策的管理並不是狹義上的規則或評分卡(Scorecard)模型,而是廣義上對整個風控策略的體系化管理,還應覆蓋包括模擬驗證、冠軍/挑戰者實驗(A/B測試)、版本管理、效能評估在內的全生命週期,如果有人工審覈環節的話,也需要納入風控體系進行統一管理。

工慾善其事必先利其器,爲了提升管理效率,決策引擎的使用必不可少。無論選用開源軟件、成熟產品,或是自建,都要確保風控決策獨立於代碼版本,可實現熱發佈,便於版本回溯。風控決策的構建,應該是自頂向下的,頂層應當是產品場景與風控場景,例如電商分期、教育分期、信用卡代償等等,風控場景包括風控審批、額度、定價、催收等各個環節。

如何“謹慎”使用“數據驅動”的風控模型(二)——決策篇

決策如何合理編排、高效管理?不妨參考以下原則:

清晰的定義頂層場景,而各個子決策以流程的方式組合而成,子決策包括一系列決策步驟,決策步驟內嵌規則集(可以將評分卡也看作是一套規則集)。
將“因果關係”的專家規則與“相關關係”的機器學習規則有機結合,力爭在通過率與壞賬率之間取得最優平衡。
某些子決策作爲通用步驟,可以被不同的產品場景共用、繼承(derive)或覆蓋(override),便於統一管理。例如,失信被執行人命中、存在嚴重逾期或銀行卡四要素錯誤等專家規則,不僅適用於電商分期產品,也適用於信用卡代償類產品。
強規則命中直接拒絕,不必執行後續規則(強規則指捕獲率極高的規則,如存在嚴重逾期歷史、手機使用少於3個月等欺詐嫌疑極高的規則;或者是不符合借款條件,如不滿18歲;強規則早期大部分來源於專家規則,後續隨着數據的積累也能總結出新規則)。
無成本/低成本規則優先於高成本規則執行,如自有黑名單規則優先於外部調用的黑名單規則。
決策不應只有通過、拒絕兩種結果,應可以支持類灰名單命中之後的人工判斷。
決策順序的調換,不應影響到整體業務流程,造成流程的中斷或異常。
如某項規則的輸入來源於外部徵信數據,需要定義好超時重試、跳過策略,避免因數據源的問題導致的決策中斷、或因此作出的錯誤決策。

出於“謹慎性原則”,決策發佈前必須進行歷史數據模擬。從大量數據的模擬中,可以發現潛在的問題;分析該決策組合的通過率、捕獲率、潛在ROI,是否優於原來的決策組合;同樣,歷史數據模擬也可以用來驗證外部徵信數據或人工審批的有效性,是否使用,放在哪一步決策使用,如何互相替代。
如何“謹慎”使用“數據驅動”的風控模型(二)——決策篇

再來談談冠軍/挑戰者實驗(A/B測試)。儘管歷史數據的模擬表現很優異,並不代表新的決策可以經得住實戰的考驗,基於“謹慎”的原則,新決策最好按較低的比例與老決策同步運行。運行一段時間後,如新決策的表現優於老決策,可以逐步將新決策的線上運行比例調高,直至完全替代老決策。爲了提高效率,多個新決策可以同時執行冠軍/挑戰者實驗。

如何“謹慎”使用“數據驅動”的風控模型(二)——決策篇

最後稍微談一下用於信用風險評估的評分卡模型。人們常提的評分卡一般指基於客戶的一組輸入數據,計算出一個評分(數字)。設計一張評分卡一般有兩個路徑:(a)請專家根據要解決的問題,依據經驗設計。一般適用於數據較少的情況;(b)基於數據和算法產生,一般適用於數據比較豐富的情況。算法可以有很多種,人們常用的有邏輯迴歸,支持向量機,決策樹,隨機森林,神經網絡等等。還有一些專用算法,如美國通用的FICO信用評分就是基於自己的算法創建的。

如何“謹慎”使用“數據驅動”的風控模型(二)——決策篇

信用風險控制所用的評分卡主要是預測信貸人的違約概率。如何評估評分卡的優劣?在評分卡部署到生產系統之前,需用現有的不同數據組進行迴歸驗證,確保驗證的違約概率與評分卡所預測的概率吻合較好。評分卡投入使用後,一定要持續監控,隨時準備調整閾值。當然還有其他的評估方法,如使用評分卡的KS,ROC曲線等。

根據我們的經驗,評分卡的使用效果取決於客羣,客戶特徵數據的選擇和數據的真實性保證,創建評分卡的方法,創建者和運行者等多種因素,是一項系統工程,而非像跑一個機器學習算法那樣簡單而又神祕。

最後出於“謹慎”原則,需要將決策編寫、模擬、檢驗、發佈的流程固化,任何決策發佈之前需要得到授權人的審批,避免因人爲過失造成的損失。發佈之後,實時監控表現,通過完整的效能評估方法驗證決策的有效性。如何監控,敬請期待即將推出的最後一篇:如何“謹慎”使用“數據驅動”的風控模型(三)——監控篇。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章