【科技金融】如何選擇合適的第三方數據源

轉:原文鏈接:https://mp.weixin.qq.com/s/jtaJWqR6SRnw5GLLC54dbw
不論是銀行還是非銀機構進行金融信貸產品展業過程中,都需要持續的與外界資源進行互換溝通。獲客、導流、風控、委外催收,正是因爲整個產業鏈條的分工合作,金融信貸產業纔可以總體維穩、獲益。

不論是金融第一梯隊銀行類,還是二、三梯隊非銀機構,風控部門在進行信貸風險控制環節都需要接入大量的第三方外部數據,以此支撐信用風險精準判斷與預險。

如何選擇合適的第三方數據源,保證風險可控的前提下節省數據成本,一份實操案例教你來選!

案例介紹

一份案例:現有1000個樣本數據,分別測試2家黑名單,2家欺詐名單與2家多頭,如何選擇合適的第三方數據源?

首先要專業科普選擇第三方數據源重要考察的5大指標計算公式(以黑名單爲例):

1.查得率(Search rate)=查得數/樣本量
2.覆蓋率(Cover rate)=查得命中黑名單數/樣本中命中黑名單量
3.誤拒率(Error reject rate)=查得命中黑名單數/樣本中通過且爲Good量
4.有效差異率(Effective difference rate)=查得命中黑名單數/樣本中通過且Bad量
5.無效差異率(Invalid difference rate)=查得命中黑名單數/樣本中其他拒絕量

其中SR、CR、EDR指標越高越好,ERR越低越好,IDR與EDR結合起來觀察,如果IDR和EDR都較高,反應的一種情況是數據源定義黑名單是廣撒網式,黑名單質量相對不夠精準。

其中前三個指標是重點考察,如果想更全面的測試第三方數據源,後面兩個差異率指標也可以加入考覈標準。

測試數據與考覈指標關係圖如下
在這裏插入圖片描述

數據介紹
在這裏插入圖片描述
1000個測試樣本數據中,審批結果字段表示樣本通過和拒絕,其中通過樣本中有未逾期和發生逾期的客戶樣本,拒絕樣本中有通過黑名單庫拒絕客戶,也有其他原因產生拒絕。比如,數據源1(黑名單)代表一家提供黑名單數據的數據供應商A,數據源2(黑名單)代表另一家提供黑名單數據的數據供應商B,以此類推。

分析方法

本次以黑名單數據測試爲例講解
在這裏插入圖片描述
對1000條測試數據返回結果進行整理可以總結出如上數據概要,對比看到數據源1的返回結果如下:

1.查得總量814個;
2.命中黑名單35個;
3.通過中爲Good3個;
4.通過中爲Bad8個;
5.其他拒絕爲22個;

數據源2的測試返回情況以此類推。

採用專業考察第三方數據源的五大指標,對以上返回結果計算分析得到以下結果:

在這裏插入圖片描述

按照文章開始介紹的指標分析方法,對比數據源1和數據源2的測試結果可以得出如下結論:

1.數據供應商1的查得率、覆蓋率高於數據供應商2大約5%、4%;
2.數據供應商1的誤拒率低於數據供應商2大約0.3%;
3.數據供應商1的有效差異率低於數據供應商2大約8%,無效差異率低於數據供應商2大約7%;

依據五大指標分析標準,SR、CR、EDR指標越高越好,ERR越低越好,IDR與EDR結合起來觀察,如果IDR和EDR都較高,反應的一種情況是數據源定義黑名單是廣撒網式,黑名單質量相對不夠精準!

最終分析結論:

數據供應商2雖然覆蓋的黑名單比數據供應商1的更廣,但其不如數據供應商1精準,更偏向選擇數據供應商1的黑名單數據。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章