全面瞭解風控數據體系

考察一個人的判斷力,主要考察他信息來源的多樣性。無數的可憐人,長期生活在單一的信息裏,而且是一種完全被扭曲、顛倒的信息,這是導致人們愚昧且自信的最大原因。

——阿瑪蒂亞·森(諾獎得主)

說明

傳統金融的風控主要利用了信用屬性強大的金融數據,一般採用20個緯度左右的數據,利用評分來識別客戶的還款能力和還款意願。信用相關程度強的數據維度大概在10個左右,包含年齡、職業、收入、學歷、工作單位、借貸情況、房產,汽車、還貸記錄等;而互聯網金融公司在利用大數據進行風控的同時,會根據需求利用多維度數據來識別借款人風險,維度包括不限於:社交類數據、消費類數據、行爲類數據、多源銀行賬戶數據等。

所以,本文結合中國互聯網發展,以及目前的徵信監管要求,對可用數據及可用風控類數據做一個全面的梳理。先來一張鎮樓圖:

圖片

本文核心建議閱讀內容:

  • 多源內外部數據字典
  • 三方公司風控產品清單
  • 三方數據測試流程

全文總計2.4w字,因內容較長,可分四部分進行閱讀:

  • 1. 數據相關概念
    • 數據定義
    • 數據結構
    • 數據質量
    • 數據問題
  • 2. 風控數據來源
    • 數據應用邏輯
    • 用戶進件提供
    • 內部系統生產
    • 外部機構合作
  • 3. 內部數據挖掘
    • 數據收集
    • 數據存儲
    • 數據處理
    • 數據挖掘
    • 數據分析
  • 4. 外部數據接入
    • 產品清單
    • 明確需求
    • 合作對接
    • 離線批量測試
    • 在線接口測試
    • 生產環境調用

本文由正陽能量場成員:正陽、思茂及其他正陽學院成員共同完成。

本着對讀者負責的態度,本文作者行文時儘可能做到以下幾點:結構完整、內容真實、邏輯清晰、重點突出、刪繁就簡,用關鍵詞、數據、配圖案例體現風控數據的類型、應用、評估等。如有細節問題,可聯繫作者共同探討。

本文內容難免有疏漏,尤其是很多地方寫的都較爲片面,需要不斷更新完善,如需瞭解更多,請移步“正陽能量場”,多謝!

注:文中內容,如有侵權處,請聯繫筆者刪除,感謝支持。


1.數據相關概念

1.1 數據定義

數據(data)是事實或觀察的結果,是對客觀事物的邏輯歸納,是用於表示客觀事物的未經加工的原始素材。數據可以是連續的值,比如聲音、圖像,稱爲模擬數據。也可以是離散的,如符號、文字,稱爲數字數據。在計算機系統中,數據以二進制信息單元0,1的形式表示。

1.2 數據結構

數據類型:八種基本數據類型:byte、short、int、long、float、double、boolean、char。

數據維度:從多個角度(時間、地域、機構等方面)研究一個對象的信息,其中,被研究對象爲實體,研究角度就成爲維度。

靜態數據:幾乎不會改變的數據;

動態數據:隨時間改變的數據。

動態數據與交易有關,針對不同的時期計算,如過去的1個月、3個月、6個月或12個月。

1.3 數據質量

數據透明度:充分評估風險所需的數據充足程度。

數據數量:數據的深度和廣度,由可得性和同質性決定。

數據質量:數據能否符合某具體需求。高質量的數據應該具備相關性、準確性、完備性、時效性和一致性。關聯性、準確性、完備性、時效性、一致性、對徵信機構的影響。

數據設計:定義數據的類型。從實踐或統計的角度出發,考慮數據缺失、分母爲零的特例和數據設計的問題,最大化數據的價值。

數據類型、表格設計

1.4 數據問題

個人信息:法律規定,經過匿名化或者去身份化處理且不能復原的信息不屬於個人信息。

合法合規性:確認數據合法性的邊界,在合法合規的基礎上對數據進行挖掘、存儲、應用。

商業化、數據歸屬、數據竊取、數據隱私、合規輸出、安全性、數據治理、數據全面、公正。

數據污染

數據商業化:數據商業化輸出的所有數據均不涉及原始數據。傳輸數據進行匿名化、去身份化,消除數據的身份可識別性。數據傳輸通過加密通道進行,保障數據傳輸過程中的安全性和可追溯性。

數據安全性:嚴格遵守數據管理流程,杜絕黑客、白客入侵,建立完善的數據安全管理體系。

使用目的:目的限制原則。合法合規,不能用於法律規定禁止行業。

數據存儲:合作中所涉及的所有數據全部被存儲在中華人民共和國境內。

數據保留:收到數據收集方或用戶最終刪除數據通知後,根據適用法律要求刪除用戶原始數據。

2.風控數據來源

2.1 數據應用邏輯

常見風控流程中,客戶准入時提供的資信材料有限,業務機構風控數據體量不足,僅僅根據內部風險數據進行風險評估會非常片面,無法全面的把控某位客戶的風險情況,所以通常需要依賴於第三方供應商提供數據作風控支撐。

第三方供應商基於自身的平臺整合成數據網絡,可關聯更多的風險信息;而業務方僅需要根據自身儲備的風險數據維度,適量補充短板,實現更全面的覆蓋即可。對三方數據的使用,必須從貼近業務的角度出發。

本節,我們首先思考信貸業務風險類型,之後考慮爲了解決不同類型的信用風險所需構建的用戶風險畫像依據。以此瞭解客戶的信用習慣、借款目的、還款能力和還款意願等。

2.1.1 瞭解業務類型

2.1.1.1 機構類型

銀行機構

銀行機構-傳統銀行

銀行機構-網絡零售銀行

銀行機構-信用卡(類信用卡)

非銀機構

非銀機構-p2p

非銀機構-小貸

非銀機構-持牌小貸

非銀機構-持牌網絡小貸

非銀機構-持牌小貸機構

非銀機構-持牌消費金融

非銀機構-持牌汽車金融

非銀機構-持牌融資租賃

非銀機構-現金類分期

非銀機構-消費類分期

非銀機構-代償類分期

2.1.1.2 業務類型

線上現金分期

線上消費分期

線下現金分期

線下消費分期

汽車消費分期

線上小額現金貸

信用卡(類信用卡)

2.1.2 梳理風險類別

瞭解不同業務類型、不同場景、不同定價利率的消費分期產品,所對應的信貸生命週期及信用風險類別。

2.1.2.1 貸前

惡意註冊;欺詐風險;准入風險;信用風險;多頭風險;定價風險;提現風險等。

2.1.2.2 貸中

償債風險;共債風險;投訴風險;額度管理等。

2.1.2.3 貸後

催收級別;失聯風險等。

2.1.3 制定風控流程

註冊信息提交;生物信息識別;准入規則判定;身份信息驗證;三方數據覈驗;授信定額定價;用戶確認提現;貸中行爲監測;額度利息管理;貸後催收管理等。

2.1.4 構建風險畫像

2.1.3.1 瞭解用戶屬性

人口屬性:性別、年齡、職業、學歷、收入、房車等;人生階段:在校、工作、備婚、備孕等。

家庭屬性:農業或非農業 五保戶 低保戶 復員退伍軍人 獨生子女家庭 二女戶 特困戶 企改下崗人員。

位置屬性:常駐地地址、家鄉地址、工作地址、地點偏好、差旅目的地等。

社會屬性:黨員/團員。

價值屬性:有無車標識等。

消費屬性:消費水平、消費品級、購買方式、購物行爲、消費偏好等。

行爲屬性:生活行爲、金融行爲、旅遊行爲、社交行爲等。

興趣屬性:金融偏好,上網目的等。

工作屬性:白領/藍領。

行業屬性:房地產行業、教育行業、教育培訓、旅遊行業、汽車行業等。

設備屬性:設備類型、設備價格、應用偏好,設備安裝、卸載、打開、活躍,設備價格、關聯手機號個數等。

2.1.3.2 瞭解個人資質

個人資質:查詢用戶消費、收入、資產、職業等信息,對用戶消費等級、消費偏好、收入穩定性、職業穩定性等信息進行評估。

穩定性評估:收入穩定性、家庭穩定性、位置穩定性等。

2.1.3.3 評估還款能力

履約能力:判斷收入範圍,收入能力水平,消費能力水平,判斷高淨值用戶

直接體現或者間接體現還款能力的:

家庭人數:家裏人多,你還不起,催收後有人可以幫你還;

婚姻狀態:大部分家庭,結婚的比未婚的家庭收入或經濟穩定更好;

收入水平:單位名稱、單位電話、工作職務、單位性質、收入來源、收入水平,直接體現收入水平及收入穩定性情況;

償債壓力指數:用戶本人當前償債壓力指數的情況。數值越大,壓力越大。

企業經營:經營企業詳情、其他資質等信息。

2.1.3.4 評估還款意願

貸款屬性:多平臺借貸情況等。

團伙欺詐排查:團伙欺詐排查通用版是基於自有海量數據,通過算法挖掘用戶的團伙欺詐行爲。

歷史借貸記錄:瞭解用戶借貸意向,借款用途是否虛假,瞭解用戶借貸行爲,借貸行爲偏好

對用戶還款能力進行評估,對用戶還款意願進行評估。

歷史欺詐記錄:多頭借貸傾向,信用風險提示,信用逾期預測。

**綜合信用情況:**查詢用戶消費、收入、資產、職業等信息,對用戶消費等級、消費偏好、收入穩定性、職業等信息進行評估。

2.1.3.5 用戶全面畫像

身份信息畫像:身份證、銀行卡、手機卡、學歷、職業、社保、公積金;

資產負債畫像:資產信息、負債信息

工作學歷畫像:簡歷信息、學信網信息

家庭關係畫像:家庭成員信息

借貸行爲畫像:註冊信息、申請信息、共債信息、逾期信息;

消費行爲畫像:POS消費、保險消費、京東消費;

興趣行爲畫像:APP偏好、瀏覽偏好、消費類型偏好;

出行信息:常出沒區域、航旅出行、鐵路出行;

公檢法畫像:失信被執行、涉訴、在逃、黃賭毒;

其他風險畫像:航空鐵路黑名單、支付欺詐、惡意騙貸。

社交行爲畫像

設備指紋畫像

朋友圈風險畫像

2.1.5 選擇風控數據

2.1.5.1 數據源選擇

數據 數據 應用
用戶進件提供 個人信息 個人身份驗證,基本信息確認
聯繫人信息 關係網絡
設備信息 設備畫像
內部系統生產 用戶行爲數據 個人行爲畫像
訂單明細數據 貸中行爲監測
風險名單數據 黑名單、灰名單、白名單識別
中臺衍生數據 構建多維用戶畫像
外部機構合作 個人身份數據 個人身份驗證,個人身份畫像補充
網絡徵信數據 徵信畫像
網絡借貸數據 網貸畫像
網絡社交數據 社交畫像
網絡消費數據 消費能力,借還款能力
網絡出行數據 出行畫像,違約失聯捕捉
企業類徵信數據 企業徵信畫像
其他數據

2.1.5.2 數據應用原則

先內部後外部,先簡單後複雜,先強後弱,先規則後模型。根據產品性質和要求接入,評估內部數據能否構建足夠的用戶畫像,觀察是否需要擴展數據,接入時符合合規要,要求高效、穩定、可靠,單數據源高覆蓋度的話,可以不用接入多家比對。

2.1.5.3 應用決策思路

主要考慮以下:

長期拖欠 達到高期催收標準的逾期客戶

申請信息虛假 表填信息虛假

資料虛假 除表填外提供的其他資料虛假

僞冒 冒用他人名義申請借款

喪失還款能力 申請人死亡、重病、被捕、被通緝、高負債

用途風險 借款用於賭博、還債等非法高風險用途

同行中介 信息被公開渠道披露爲同行

法院-失信 法院失信名單

法院-被執行 法院執行名單;包含執行中、已結案、終本案件

近期存在多頭申請風險 近期在多平臺申請借款次數過多,且已達到風險閾值

模型評估低資質 基於歷史數據訓練,通過數據模型客觀預測出的低資質客戶

小額業務拖欠 在小額業務拖欠還款達到一定催收標準的逾期客戶

首逾M3 合同首期即逾期,且連續逾期至M3,欺詐可能性高

小額業務獲批困難 在小額業務難以獲批或頻繁拒貸,綜合資質差

極黑用戶和高危賬戶,納入拒絕;;關注賬戶和灰度賬戶,放入模型中;風險用戶,建議拉黑;無法確認,建議保留觀察

2.2 用戶進件提供

2.2.1 個人信息

2.2.1.1 身份信息

用戶提交信息:證件類型、證件號碼、姓名、曾用名、出生日期、年齡、戶口所在地(省)、戶口所在地(市)、籍貫、性別、婚姻狀況、教育程度、所在地居住證、社會保障卡號、公積金卡號、手機號碼、其他號碼(區號)、其他號碼(號碼)、身份證有效期限(起),身份證有效期限(至)、身份證有效期限(年)、身份證上地址;

2.2.1.2 銀行卡信息

卡號、銀行卡類型、預留手機號、綁卡身份證號、銀行卡圖片url路徑、綁卡渠道

2.2.1.3 住宅信息

地址、省份、城市、區、起始居住時間、住宅類別、郵政編碼、業主、關係、按揭供款/租金、與誰居住、總人數、居住年限、住宅電話(區號)、住宅電話(號碼)

2.2.1.4 個人工作信息

工作單位全稱:上海第二百貨公司

工作單位電話:021-60491888-201

公司所在城市:安慶市(如果需要公司詳細地址,無需公司所在城市)

公司詳細地址:所在區域+詳細地址

月收入(元):3500

工資發放形式:h’hh’h’h

工作職業:農牧業、木材/森林業、礦業/採石業、交通運輸業、餐旅業、建築工程業、製造業、娛樂業、文教、金融業、服務業、治安人員、軍人、其他)

2.2.1.5 財務資產信息

文化程度:初中以下、初中、中專、高中、大專、本科、研究生及以上

貸款用途:購車貸款、醫療美容、網購貸款、裝修貸款、教育培訓貸款、旅遊貸款、三農貸款、其他

收入來源:工資獎金、經營收入、投資理財、房租收入、其他

婚姻狀況:已婚、未婚、離異

居住所在城市:例:安慶市(如果需要居住詳細地址,則無需居住所在城市)

居住詳細地址:包含兩部分內容(所在區域+詳細地址)

1、所在區域:省、市、區縣,例:江蘇省-南京市-宣武區

2、詳細地址:住宅類型:(選項:租房、產權房產、父母所有房產、公司宿舍、其他)

現居住地居住時長:(選項:1年以下、1-3年、3年以上)

常用郵箱:例:[email protected]

2.2.2 聯繫人信息

姓名、關係、是否知悉貸款、手機號碼、公司名稱、職位、年齡、電話區號、座機號碼、工作年限、每月收入

第一聯繫人:父母、配偶、親屬

第二聯繫人:同學、同事、朋友

2.2.3 設備信息

GPS信息、通訊錄、通話記錄、短信記錄、安裝APP列表、設備號、IP地址、操作系統、設備類型、設備型號、openUDID、是否越獄、是否root

2.3.3.1 設備信息屬性

設備標籤、設備品牌、設備類型、Android ID、設備序列號、IMEI、IMSI、設備MAC地址、設備硬件名稱、設備主機地址、設備固件版本號、藍牙mac地址、瀏覽、UserAgent、基帶版本號、系統版本、系統設置中顯示的版本號、SDK版本號、總內存(G)、總容量(G)、可用內存(G)、可用容量(G)、電池健康狀態、電量(%)、電池狀態、CPU類型、CPU子類型、CPU數量、GPS經緯度、佔用內存(單位G)、可用內存(單位G)、wifi ssid、模擬器信息(是否是模擬器)、imei1、imei2、imsi1、imsi2、是否插sim卡、手機型號、產品製造商、設備名、主板型號、是否root、wifi mac、設備類型(手機/終端)等。

2.3.3.2 設備網絡屬性

運營商、國家代碼、移動國家碼、移動網絡號、2G/3G/4G/WIFI)、網絡信號類型、Sim卡信號類型、Sim卡序列號、外網IP、蜂窩內網IP、Wi-Fi內網IP、無線網絡的名字、bssid,默認爲路由器的mac地址、Wi-Fi掩碼、網關、代理地址和端口號、當前連接的基站信息、經度、緯度、IP地址類型、IP所屬國、IP一級行政區、IP二級行政區、IP三級行政區、IP屬主、移動設備國家代碼、移動設備網絡代碼、LAC或TAC、CELL Identity(、基站系統識別碼、基站網絡識別碼、基站小區、基站類型

2.3.3.3 用戶行爲屬性

當前時間、開機時間、運行時間(ms)、時區、設備語言、設備名稱、屏幕亮度、鍵盤列表、電話號碼、日期格式、是否自動網絡對時、是否自動時區選擇、小時格式、鎖屏時間、有可用Wi-Fi時是否提示、休眠時保持WLAN網絡的連接方式、獲取位置的精度、是否使用鎖屏圖案、是否解鎖圖案可見、是否解鎖震動反饋、字體大小、字體列表、用戶程序列表、鈴聲列表、手機鈴聲、鬧鐘鈴聲、通知鈴聲、是否打開聲音效果、是否輸入密碼顯示最後一位、是否屏幕亮度自動調節、是否屏幕自動旋轉、當前壁紙、系統程序列表

2.3.3.4 用戶註冊列表

統計n個月內,卸載/在裝應用行爲特徵;應用行爲活躍時間相關特徵:總打開次數,總使用時長;地理位置相關特徵;借款/還款信息。與有相同行爲的人羣進行縱向比較後給出得分,用戶得分越高,表示其在整個相同行爲的人羣中相比新安裝APP個數越多。

從APP的安裝、活躍情況等行爲中提取特徵,並在相同興趣人羣中縱向比較,得到用戶的國有銀行類應用偏好。值越大,代表該用戶對此行爲的偏好程度越大。

App類別: 辦公管理、便捷生活、電話通訊、電子商務、電子閱讀、教育培訓、金融理財、聊天社交、旅遊出行、拍攝美化、汽車服務、親子服務、視頻服務、系統工具 、音樂音頻、遊戲服務、運動健康、智能設備、綜合資訊

app類別偏好標籤:餐飲偏好、貸前標籤、短期狀態、階段軌跡、金融通用標籤、旅遊行爲標籤、旅遊偏好、汽車線下行爲、人口屬性、設備屬性、社會分羣、線下偏好、線下醫療健康、遊戲偏好、運動、長期狀態、資產屬性

借貸行爲偏好:設備指紋對應的借貸APP數量、消費分期APP數量、彩票APP數量、借貸APP數量佔比、消費分期APP數量佔比、彩票APP數量佔比

2.3.3.5 通訊錄列表

通訊錄,主被叫號碼,通話時長等。

2.3 內部系統生產

2.3.1 用戶行爲數據

2.3.1.1 生物識別信息

身份證信息:身份證號、身份證住址,身份證正面,身份證反面,有效日期,簽發機構

活體檢測信息:照片,活體檢測數據,狀態碼,相似度,是否本人,驗證次數。

2.3.1.2 行爲埋點信息

用戶登錄日誌,登錄信息,瀏覽信息等。

打開app時間,上次登錄時間,上次登錄IP等。

2.3.2 訂單明細數據

2.3.2.1 申請信息

申請編號;申請時間;申請渠道;申請產品:金額,週期,費率等;借款用途等。

2.3.2.2 審批信息

審批時間;拒絕原因;風險類型;審批備註;當前狀態等。

2.3.2.3 訂單信息

名單編號;借款金額;服務費;實放金額;放款狀態;放款失敗原因等。

2.3.2.4 還款信息

還款時間;還款方式;應還金額;還款通道;財務減免;滯納金額;還款狀態;還款期數;是否結清等。

2.3.2.5 催收信息

添加時間;’訂單狀態;催收員信息;聯繫狀態;最後跟進時間;備註信息;通話記錄;關鍵詞命中情況等。

2.3.3 風險名單數據

2.3.3.1 黑灰白名單

姓名,身份證,手機號,黑/灰/白原因

2.3.3.2 ip、域名名單

風險ip;風險域名

2.3.3.3 設備名單

風險設備號

2.3.3.4 渠道名單

渠道;聯繫人;聯繫電話;推廣鏈接;渠道限量;平臺流量監控;合作結算等。

2.3.4 中臺衍生數據

2.3.4.1 客戶關係管理

客戶聯繫:指與客戶互動的信息,有內向聯繫和外向聯繫兩種情況:

內向聯繫:指客戶通過詢問或投訴主動與貸款機構聯繫;

外向聯繫:貸款機構通過電話推銷或直郵與客戶聯繫,也包括貸款機構購買市場信息來決定聯繫哪些客戶。

獲客過程:申請表格的信息以及申請過程中的其他信息,特別是徵信數據和賬戶表現情況等。這些數據主要用於信貸審批和申請監控,也可以用於早期的客戶關係管理。

賬戶管理:從現有賬戶總結得到的信息,包括最小值、最大值、平均值、比率和次數等。

催收回收:催收回收信息是賬戶進入催收階段的細節信息,需要不斷更新,還有與回收相關的聯繫信息和結果。不同階段總結的信息有所不同,例如過去三個月超限的天數、過去六個月拒付次數、平均賬戶餘額、過去六個月最長逾期天數、當前逾期金額和過去六個月的還款比例等。

除了上述與信用風險管理直接相關的數據外,在賬戶操作管理、操作風險管理及客戶關係管理中也會使用其他數據。

客戶管理:客戶管理總結客戶關係,制定相應策略。產品層面的細節視機構而定,有些只需要總結信息,減少數據存檔負擔;有些需要賬戶的全面信息。還有公司用市場信息和財務信息作爲補充。

2.3.4.2 交易支付

交易數據是細節的終極體現,包括所有支付進出的信息,比如交易時間、交易金額、交易對象、交易目的、交易時間與交易金額會在支付和收取過程中體現,交易對象和交易目的則不一定。賬戶代碼和類別代碼會顯示在電子交易記錄中,商家代碼會出現在信用卡支付中,支票交易有支票編號。

2.3.4.3 授權記錄

在授權階段,信用卡交易通常會暫時放在單獨的數據庫中。一旦授權通過,交易記錄會轉到主賬戶中;如果授權不通過,交易記錄會單獨保留在別的數據庫中。非交易產品或即時交易不需要這種數據庫。

2.3.4.5 個體瞭解

客戶個人關係有時候不被歸爲借貸關係。雖然它也可能和風險有關,但由於各種原因,通常不被傳統評分卡採用。

財務狀況:財務狀況是客戶的財務信息,如資產負債表和損益表,通常針對中級市場,對中小企業和個人貸款也適用。

安全:任何增信方法都是爲了保證貸款資金的安全,包括擔保和抵押品(固定資產、流動資產、移動資產)。考慮到成本和風險,交易型貸款通常不太看中抵押品。

欺詐:我們需要已知和涉嫌欺詐的名單,包括姓名、身份識別碼、電話號碼和地址。對每個新申請都要檢索一遍,如果發現匹配則需要進一步分析。如果申請者填寫的地址和號碼與欺詐者匹配上了,但其毫不知情,申請是真實的,我們需要相應更新數據庫。

2.4 外部機構合作

數據分類:只列舉常見並且在金融領域能夠起到一定風險識別作用的數據。包括不限於金融數據、銀聯數據、運營商數據。

順序邏輯:按照獲取從難到易,數據效度從高到底排序。

數據來源:金融、房地產、零售行業、移動設備等。

數據要求:法律規定,企業合法,數據合法,用戶授權等。

數據特點:豐富、敏感、不便展示。

2.4.1 個人身份數據

2.4.1.1 個稅數據

圖片

2.4.1.2 社保數據

經用戶授權採集其社保數據,包括:社保賬戶信息、五險繳費記錄(最多10年)和醫療消費記錄

參保單位個人信息、城居養老保險繳費明細信息、城居養老保險參保人信息、參保單位基本信息、單位繳費比例、單位款項明細信息、待遇類別表、個人參保信息、醫保個人基本信息、個人賬戶實際收支記錄信息、IC卡個人帳戶餘額變化信息、繳費明細信息、款項類別信息、企業養老保險單位參保信息、企業養老保險人員參保信息、企業養老保險參保人員信息、企業養老保險人員繳費記錄、失業個人基本信息、險種應繳信息、險種子項表、醫療個人賬戶、醫療機構、醫療業務完成歷史表、醫療業務信息、正常失業待遇信息

圖片

2.4.1.3 公積金數據

經用戶授權採集其公積金數據,包括:公積金賬戶信息、繳費記錄(最多10年)和公積金貸款信息,個人公積金貸款信息、業務明細、賬戶信息、貸款業務明細、共同借款人信息、單位公積金賬戶信息。

圖片

2.4.1.4 學信數據

經用戶授權採集其學信數據,包括:學歷信息和照片、學籍信息和照片

圖片

2.4.1.5 保單數據

圖片

2.4.1.6 其他政務類數據

按政府或者事業單位部門分類數據來源:包含公安局、民政局、交警支隊、財政局、稅務局、不動產中心、工商局、公積金中心、人社局、殘聯、人民法院、綜治辦、衛計委、自來水公司等

2.4.2 網絡徵信數據

2.4.2.1 央行徵信

央行徵信數據總體上體現負債情況和信用情況的:央行徵信報告。央行徵信數據,權威、真實、合規。央行的徵信接口對所有持牌機構開放,但目前市面上的金融公司都沒有直連央行接口。因爲開發接口除了耗時費力,還關乎很多細節問題,技術、政策等,所以一般都會跟某個機構對接後,查詢央行徵信的數據。具體二代徵信變量衍生方法,可以參考同盾姚雪丹老師的一篇文章:人行二代個人徵信及變量衍生深度解讀

2.4.2.2 百行徵信

由於央行徵信系統沒有覆蓋P2P平臺等機構,百行徵信順勢而生。百行徵信也是國內唯一一家持牌市場化個人徵信機構。機構主要由考拉徵信、鵬元徵信、91徵信、安融徵信、立木徵信、憑安徵信、前海徵信、中誠信徵信、華道徵信、中智誠徵信等組成。未來百行能不能有效被使用上還有待觀察,但風控人員可先了解其相關的資料。百行徵信涉及的模塊,主要包括以下方面:

報告相關數據:報告時間;查詢原因;查詢結果等。

綜合信息:手機號數量;累計貸款筆數;居住信息;職業信息;機構查詢信息等。

未結清貸款:未結清貸款筆數/金額等。

逾期情況:當前逾期貸款筆數;當前最嚴重逾期狀態;歷史最嚴重逾期狀態;累計逾期次數等。

非循環貸情況:新增貸款筆數/金額/機構數;逾期貸款筆數/金額/機構數等。

循環貸情況:循環授信信息;新增貸款筆數/金額/機構數;逾期貸款筆數/金額/機構數等。

2.4.2.3 民間信用

芝麻信用

圖片

網貸機構黑名單

逾期名單、多頭名單、失信名單等。

2.4.3 網絡借貸數據

微粒貸

圖片

借貸寶

圖片

2.4.4 網絡消費數據

2.4.4.1 網銀數據

經用戶授權採集其網上銀行數據,包括:儲蓄卡賬戶信息和交易流水、信用卡賬戶信息和賬單明細、貸款記錄

查詢用戶網銀流水信用卡報告(目前支持16家信用卡)

圖片

2.4.4.2 銀聯數據

2.4.4.3 信用卡賬單

經用戶授權採集其郵箱中的信用卡賬單數據,包括:信用卡賬戶信息、每月賬單明細、交易流水和分期記錄

圖片

2.4.4.4 支付數據

支付寶

經用戶授權採集其支付寶數據,包括:支付寶賬戶信息、綁定銀行卡、交易流水和金融產品信息

圖片

2.4.4.5 電商數據

電商社交數據適合線上行爲活躍的羣體,尤其是適合現金貸及有場景用戶,比如3C數碼、醫美、教育等消費分期領域。對線上行爲特別稀疏的傳統的線下人羣,要利用電商社交數據做徵信評估基本不可行。

電商數據需要和其他數據配合使用,才能發揮最大的價值。

電商數據在反欺詐領域的應用來得比信用評估更直接。識別出的異常購物記錄和敏感行爲用戶壞賬率比正常客戶要高。

京東

經用戶授權採集其京東數據,包括:京東賬戶信息、收穫地址、訂單信息(最多2年)和金融產品信息

圖片

淘寶

經用戶授權採集其淘寶數據,包括:淘寶賬戶信息、收穫地址、訂單信息(最多2年)和金融產品信息

圖片

美團

圖片

餓了麼

圖片

2.4.4.6 車險保單數據

經用戶授權採集其車險保單數據,包括:保單和保費信息、車輛信息、投保人和被投保人信息

圖片

2.4.5 網絡出行數據

2.4.5.1 滴滴數據

圖片

2.4.5.2 鐵旅數據

2.4.5.3 航空數據

2.4.6 網絡社交數據

在以上的產品中,我們都能看到一個高危行爲的定義,所謂高危行爲一般爲:申請信息中身份證號關聯多個(>3個)手機號、或手機號關聯多個(>3個)身份證號。

並且在BiRong的數據中,還有一個跟查詢用戶一度關係、二度關係的數據查詢情況,

一度關係:百融關係庫中與本人有直接關聯的人,一般是直系親屬、關係緊密的朋友

二度關係:百融關係庫中與一度關係有直接關係的人

一般關於這個關係庫,我們也常使用以下規則:聯繫人的先都不拒,低風險的放開,高風險的拒絕

2.4.6.1 運營商數據

經用戶授權採集其運營商數據,包括:手機賬戶、通話詳單、短信詳單、流量詳單、繳費信息、賬單信息和套餐使用量。

圖片

2.4.6.2 QQ數據

經用戶授權採集其QQ空間數據,包括:QQ賬戶信息、好友信息和QQ羣信息

關注:借貸羣、分期羣、理財羣、薅羊毛羣、賭博彩票羣

圖片

2.4.6.3 郵箱數據

支持: qq, sina, 163, 126, vip.126, vip.163, 188, yeah, sohu, 21cn

2.4.6.4 微信數據

圖片

2.4.6.5 領英數據

經用戶授權採集其Linkedin(領英)數據,包括:領英賬戶信息、教育經歷、工作經歷和職場人脈信息

圖片

2.4.7 企業類徵信數據

功能:判斷法人是否涉嫌欺詐、企業是否涉嫌欺詐、法人是否失信、企業是否失信、法人不良名單、企業是否欠稅、企業基本工商信息、企業工商數據、風險信息查詢。

分類:企業類型、工商數據、稅務數據、發票數據、涉稅數據、涉訴數據、海關數據、環保數據、信用數據、招聘數據、新聞數據、商標數據、知識產權、軟件著作、受懲黑名單數據、大企業股權出質、大企業動產質押、經營異常、公司產品、動態情報、網站信息、控股公司、聯繫信息、股權凍結、動產抵押、受益人、嚴重違法、簡易註銷、工商快照、實際控制人、股權出質、對外投資、對外投資穿透、經營狀況、經營風險。

細分:利潤表(小企業會計制度)_年報信息、企業資產負債表(小企業會計制度)、企業利潤表(小企業會計制度)、小規模納稅人申報明細主表、一般納稅人申報明細主表、企業違法違章、企業申報信息、納稅人信用等級、企業投資方(自然人出資信息)、企業變更信息、企業欠稅信息、企業主要人員

圖片

2.4.7.1 司法數據

2.4.7.2 經營數據

水、電、氣,財務等。

2.4.7.3 發票數據

圖片

2.4.7.4 稅務數據

列舉下幾個稅種的介紹說明:

增值稅

1.對企業生產經營過程中,價值增值的部分進行的徵稅(只對經營過程中增加的附加值徵稅,避免了重複徵稅))

  1. 進項稅:企業收到其他企業開具的專票上的稅額叫進項稅,可以抵扣

  2. 銷項稅:企業自己開具給別人的發票上的稅額是銷項稅,也就是自己取得收入該繳納的稅款;

企業所得稅

1.除了增值稅,企業如果有盈利,還要繳納企業所得稅

計算公式爲:企業所得稅=應繳納所得額*25% 高新技術企業可獲得10%的所得稅減免

個人所得稅

1.向個人徵收的,企業需要進行代扣代繳;

2.個體工商戶的經營所得也需要繳納個人所得稅;

另外在票稅類數據構成上,主要有以下類型:

企業基本信息、工商、稅務登記信息、納稅信用評級、納稅申報信息、實際繳納信息

2.4.8 其他數據

機動車登記;城市電話黃頁;房地產服務等。

3.內部數據挖掘

數據全生命週期管理(一)https://mp.weixin.qq.com/s/cK_GMBnks7JNyDZs4di_MA

3.1 數據收集

3.1.1 收集來源

3.1.1.1 用戶基本信息

由用戶通過app提交。關於用戶基本信息,需要特殊處理的字段可能包括身份證、地址等。

3.1.1.2 訂單記錄

由系統生產。表格數據完整,缺失程度低,挖掘之前通常需要進行多表關聯查詢。

3.1.1.3 催收記錄

可以從運營平臺輸入,也可人工記錄後批量導入。涉及一些點通話記錄和人工標籤,會有關鍵詞識別和特殊字符處理的需求。

3.1.1.4 三方數據源

通過api方式獲取。主要是一些多層嵌套json數據,需要進行解析之後根據需求存入不同類型的數據庫,備用。

3.2 數據存儲

3.2.1 數據存儲形式

不同類型、體量的數據,需要使用不同的數據庫進行存儲,根據業務要求,可參考以下幾點:

Mysql:可存儲如日常訂單數據。

Redis:可存儲如實時進件請求。

Mongodb:可存儲如三方接入數據。

Neo4j:可存儲如用戶之間的關係數據。

Hbase:可存儲如日誌明細、交易清單、軌跡行爲等。

Hive:可存儲大量流水數據。

數據庫的選用,主要與其設計及性能相關:

Mysql:mysql是關係型數據庫,主要用於存放持久化數據,將數據存儲在硬盤中,讀取速度較慢。

Redis:Redis 是NOSQL,即非關係型數據庫,是一個高性能的key-value緩存數據庫,即將數據存儲在緩存中,緩存的讀取速度快,支持主從同步, 能夠大大的提高運行效率,但是保存時間有限。

Mongodb:MongoDB是一個介於關係數據庫和非關係數據庫之間的產品,是非關係數據庫當中功能最豐富,最像關係數據庫的。它支持的數據結構非常鬆散,是類似json的bson格式,因此可以存儲比較複雜的數據類型。Mongo最大的特點是它支持的查詢語言非常強大,其語法有點類似於面向對象的查詢語言,幾乎可以實現類似關係數據庫單表查詢的絕大部分功能,而且還支持對數據建立索引。

Neo4j:存儲節點數據,如網絡節點之間的關係數據。是一個高性能的,NOSQL圖形數據庫,它將結構化數據存儲在網絡上而不是表中。neo4j適合於社區網站的關係:用戶之間的關係有朋友關係,親友關係,同事關係等,把每個人來看作是一個結點,用戶與用戶之間的關係看作是一條邊,這樣整個社源區就像一張大的圖一樣。

Hbase:存儲量級要求比較大、數據更新頻繁、查詢複雜度高、字段擴展性好的數據。Hadoop database 的簡稱,也就是基於Hadoop的數據庫,是一種NoSQL數據庫,主要適用於海量明細數據(十億、百億)的隨機實時查詢

Hive:Hive是Hadoop數據倉庫,嚴格來說,不是數據庫,主要是讓開發人員能夠通過SQL來計算和處理HDFS上的結構化數據,適用於離線的批量數據計算。Hive 沒有專門的數據存儲格式,也沒有爲數據建立索引,Hive 中所有的數據都存儲在 HDFS 中,Hive 中包含以下數據模型:表(Table),外部表(External Table),分區(Partition),桶(Bucket)。

在大數據架構中,Hive和HBase是協作關係,數據流一般如下圖:

  1. 通過ETL工具將數據源抽取到HDFS存儲;
  2. 通過Hive清洗、處理和計算原始數據;
  3. HIve清洗處理後的結果,如果是面向海量數據隨機查詢場景的可存入Hbase
  4. 數據應用從HBase查詢數據;

圖片

3.3 數據處理

3.3.1 表格數據處理

時間格式;範圍約束;脫敏處理;離散化處理;變量衍生等。

3.3.2 自然語言處理

分詞;標註;命名實體;情感分析;地址分析;文本挖掘等;

3.3.3 地理位置解析

歸屬地解析:針對上傳的ip、GPS、手機號等信息的歸屬地進行詳細的解析,輸出對應的歸屬地信息;處理如分級地址、GPS座標、文本地址等地址數據。

3.4 數據挖掘

3.4.1 分類標籤

分類(classification),對於一個分類員來說,通常需要你告訴它“這個東西被分爲某某類”,理想情況下,一個分類員會從它得到的訓練集合中進行“學習”,從而具備對未知數據進行分類的能力,這種提供訓練數據的過程通常叫做supervised learning(監督學習)。

在很多業務場景中,即使一些很常見如男女、學歷、是否有車、是否有孩、是否可聯等的標籤,只要用戶沒有直接提供或者無法直接得出結論,都需要去基於業務理解和大量留存數據對齊進行分類分析。

3.4.2 聚類標籤

聚類(clustering),簡單的說就是把相似的東西分到一組,聚類的時候,我們並不關心某一類是什麼,我們需要實現的目標只是把相似的東西聚到一起,因此,一個聚類算法通常只需要知道如何計算相似度就可以開始工作了(距離矩陣),因此clustering通常並不需要使用訓練數據進行學習,這在Machine Learning中被稱作unsupervised learning(無監督學習)。

3.4.3 關係網絡

可視化關聯圖譜(樹圖、發散圖、力導向圖、弦圖)

3.5 數據分析

多維統計分析

關聯性分析

插值預測分析

違約預測分析等

4.外部數據接入

4.1 產品清單

4.1.1 稽查覈驗類

通過驗證客戶申請信息之間的關聯關係,來判斷客戶的風險。

4.1.1.1 基本信息

姓名:請求信息中的姓名

年齡:請求信息中根據身份證號計算的年齡

性別:請求信息中根據身份證號計算的性別

郵箱:公積金中郵箱

身份證認證:請求信息中的身份證號碼

身份證歸屬地:請求信息中身份證的歸屬地

銀行卡認證

手機號實名認證

身份證二要素認證:身份證號+姓名——從身份證和姓名的信息,返回個人的信息匹配情況,是否存在該身份證信息,覈查身份證姓名是否一致。

手機號三要素驗證:驗證移動、聯通、電信手機號與綁定身份證號和姓名是否一致。

銀行卡四要素驗證:驗證用戶銀行卡號、姓名、身份證號、手機號與銀行預留信息是否一致。

檢測輸入的姓名、身份證號碼、銀行卡號是否一致

檢測輸入的姓名、手機號碼、身份證號碼、銀行卡號是否一致

根據銀行卡號判斷真僞、查詢類型、logo、客服電話

通過銀行卡查詢,可以判斷卡類型

輸入銀行卡號返回銀行名稱、卡類型及卡歸屬地等信息

銀行聯行號查詢,可根據關鍵字,銀行名稱、銀行卡號,省,市等查詢,返回結果包含電話、地址等

檢測輸入的姓名、銀行卡號是否一致

身份證認證(不返回照片):認證姓名和身份證是否一致(支持大陸公民的身份證認證)

身份證認證(返回照片):認證姓名和身份證是否一致,一致時返回身份證頭像照片(支持大陸公民的身份證認證)

銀行卡兩要素認證:認證姓名.姓名和銀行卡號是否一致;

銀行卡三要素認證:認證姓名.身份證和銀行卡號是否一致;

銀行卡四要素認證:認證姓名,身份證,手機號和銀行卡號是否一致;

銀行卡四要素認證(發短信):認證姓名,身份證,手機號和銀行卡號是否一致,一致後向商戶手機號發送認證碼進行短信校驗;

打款認證:通過比對商戶打款金額與被認證用戶實收金額是否一致,以此來認證銀行卡歸屬

**4.1.1.2 **身份信息認證

學歷學籍認證;社保公積金認證;支付寶實名認證;淘寶認證;公積金認證;網銀賬單認證;信用卡賬單數據;借記卡賬單數據等。

4.1.1.3 生物識別

人臉識別驗證:對比用戶提供照片與身份證照片的相似度。

照片比對:OC認證,虛假身份證等僞冒風險的剋星

人臉對比:測進件的是不是一個真實的人

活體識別

4.1.1.4 運營商信息驗證

短信認證

手機所屬運營商:請求信息中手機號碼所屬的運營商

手機號碼歸屬地:請求信息中手機號碼的歸屬地

手機在網狀態:驗證移動、聯通、電信手機的在網狀態。

手機在網時長:驗證手機的在網時長區間,按自然月統計。在網時長=銷號時間-開戶時間,停機計入時長。

手機號歸屬定查詢;家庭固話;進件單位電話覈驗;三方單位電話覈驗等。

4.1.1.5 地址信息驗證

輸入地址與手機號碼地址、最近使用地址、歷史使用地址的關聯。

身份證號手機號歸屬地:查詢身份證號和手機號所屬地區。用戶詳細地址信息與機構地址信息庫的一致性覈查。

家庭地址校驗;企業位置覈驗;單位地址驗證;常駐地址覈驗;GPS地址校驗等。

4.1.1.6 借貸行爲驗證

借貸行爲驗證:用戶在百融的虛擬信貸聯盟中的借貸行爲情況。

借貸意向驗證:用戶近7/15天、1/3/6/12個月在百融的虛擬信貸聯盟(銀行、非銀、非銀細分類型)中的多次信貸申請情況。

4.1.1.7 政法信息認證

法院信息詳情-個人版:查詢個人涉及法院信息的詳情,共8類:開庭公告、案件流程、網貸黑名單、裁判文書、執行公告、失信公告、法院公告、曝光臺。

法院信息詳情-企業版:查詢企業涉及法院信息的詳情,共8類:開庭公告、案件流程、網貸黑名單、裁判文書、執行公告、失信公告、法院公告、曝光臺。

法院被執行人:法院失信被執行人、被執行人的執行案件信息。

公安黑名單(不良犯罪記錄):在第一條的基礎上,是否還能檢測到該身份證有名字公安庫中的不良犯罪記錄等,目前有個別廠家能支持這樣的信息查詢。

4.1.1.8 車輛信息查驗

車主認證:所有人姓名,所有人覈驗結果,手機號碼,準駕車型,車產狀態,有幾輛車

車輛認證:車牌號是否匹配,初次登記日期,號牌號碼,號牌種類,發動機號碼,車產價值(範圍)

4.1.1.9 其他信息覈驗

4.1.2 名單標籤類

通過三要素信息匹配風險名單庫,精準有效識別高中風險客戶。高質量動態更新的風險名單庫。數千萬高質量風險名單,分爲高風險、中風險,其中信貸類數據佔70%以上,數據貼合金融場景,誤殺率低

包括銀行、持牌消金、保險、信託、汽車金融、互聯網金融機構等。

是否命中,命中名單種類

機構類型:P2,PP2P-車貸,P2P-房貸,非持牌消金,非持牌消金-小額現金貸,非持牌消金-消費分期,持牌消費金融,銀行,融資租賃,小貸,典當,擔保,平臺門戶,資金平臺,保險等。

查詢機構:將查詢機構的類型,分成銀行機構(含信用卡)跟非銀機構(含全部非銀類型)兩類信息。包括P2P、 消費類分期、現金類分期、代償類分期、其他銀行、持牌汽車金融、持牌融資租賃、持牌網絡小貸、持牌消費金融、持牌小貸、非持牌小貸。

查詢標識:通過身份證查詢,通過手機號查詢,通過聯繫人手機查詢,郵箱,設備

查詢主體:本人直接命中,聯繫人、與用戶有親密關係的人(一度關係、二度關係-關係庫定義)

查詢結果:高風險,中風險,一般風險,資信不佳,拒絕,法院被執行人,法院失信人,公安信息異常,虛假申請、欺詐。

統計口徑:是否命中,命中次數,距今時間

:持牌汽車金融高風險命中次數較多。

4.1.2.1 黑名單

高風險-信貸行業-信貸欺詐黑名單;內部黑名單;機構黑名單;徵信黑名單;信用卡欺詐黑名單;運營商黑名單;網購黑名單等。一經標記,最好再無業務往來。

4.1.2.2 風險名單

4.1.2.2.1 違約風險名單

徵信風險名單

信貸逾期:機構逾期,平臺標記風險

用途風險:借款用於賭博、還債等非法高風險用途

不良客戶:低資質且有較高還款風險的客戶

喪失還款能力:申請人死亡、重病、被捕、被通緝、高負債

嚴重欺詐\嚴重違約\歷史高危行爲

高風險交易\信貸行爲、高危網絡行爲

長期拖欠:達到高期催收標準的逾期客戶

4.1.2.2.2 欺詐風險名單

疑似欺詐或高風險

是否欺詐人員

信貸欺詐:支付欺詐,惡意騙貸,違法黑產。欺詐風險提示,欺詐作案APP用戶。

垃圾賬號:養號,盜號,註冊、貸款、短信驗證時可能對平臺發起攻擊

資料虛假:除表填外提供的其他資料虛假,申請信息虛假:表填信息虛假

惡意欺詐:疑似存在欺詐歷史

僞冒包裝:疑似用虛假資料包裝,冒用他人名義申請借款

惡意行爲:在社交、o2o、社區等疑似有不良的行爲

營銷欺詐:比如薅羊毛

風險交易:盜刷、洗錢、刷單,套現,境外欺詐

同行中介:信息被公開渠道披露爲同行

4.1.2.2.3 多頭風險名單

多頭借貸:判斷匹配維度任意1小時到90天時間段內的申請多頭數量是否存在過多現象。

徵信多頭名單

機構多頭名單

4.1.2.2.4 白戶風險名單

白戶申請:判斷匹配維度任意1小時到90天時間段內是否不存在申請記錄。

4.1.2.2.5 銀聯風險名單

銀聯風險首單商戶:是否可疑商戶,是否風險商戶,是否收單預警商戶。

銀聯不良持卡人:是否不良持卡人,是否經濟犯罪人員,是否涉恐人員,是否觸犯風險規則人員。

不良銀聯卡:是否欺詐交易卡片,是否涉案卡片,是否線下卡號黑名單,是否線上卡號黑名單,是否其它卡號黑名單。

銀聯風險電話:是否線上的交易手機號黑名單,是否虛假電話號碼,是否詐騙、中介、違法電話號碼。

4.1.2.3 負面逾期

公共失信、信貸逾期、交易欺詐;不良中介;虛假申請;風險用途;賬戶盜用;關聯欺詐等。

身份證負面情況;手機號負面情況;聯繫人負面情況;郵箱設備負面情況等。

4.1.2.4 特殊名單

資信不佳:提供的申請資料未達到准入標準、信息被僞冒

4.1.2.4.1 政府失信名單

工商偷稅漏稅,股權凍結,無照經營,法院被執行人,行政處罰

法律灰名單:高危用戶,在逃嫌犯,法院失信。

涉訴名單

通緝名單

限制高消費名單

限制出入境名單

綜治辦名單:吸毒、上訪、刑滿釋放人員、社區矯正人員等。

衛計委名單

法院被執行人:被執行人是指在法定的上訴期滿後,或終審判決作出後,拒不履行法院判決或仲裁裁決的當事人

法院失信被執行人:具有履行能力而不履行生效法律文書確定的義務,但是故意抗拒執行義務的被執行人

其他不良記錄

4.1.2.4.2 行業催收名單

針對申請人與催收電話、疑似催收電話的通話行爲進行分析,返回催收通話頻度、主/被叫、時長、週期等數據統計,返回近100個數據變量用於建模和客戶篩選

4.1.2.5 聯合建模標籤

聯合建模標籤是根據人機結合,人工分類後,再經過大量機器學習、深度學習算法學習衍生;結合了真實貸後數據校驗,對聯合建模中逾期表現區分度較大,IV值普遍在0.2以上;爲客戶的貸前、貸中、貸後風險識別提供多維度的數據支持,能夠精準預測用戶風險等級,實現用戶有效分層。

4.1.3 評分評級類

4.1.3.1 基於評分功能

(信用)信用評分產品

(欺詐)欺詐評分產品

(價值)價值評分產品

(價值)綜合信用評級

4.1.3.2 基於應用場景

根據評分需求,增加實時運營商抓取信息、第三方支付信息、信用卡賬單信息等數據內容,構建適用於場景的定製評分。

(現金貸)小額信貸評分

(現金貸)現金分期評分

(消費貸)場景分期評分

(消費貸)場景定製

(消費貸)線下消費分期

(消費貸)線上現金分期

(信用卡)信用卡評分

(信用卡)虛擬信用卡

(信用卡)信用卡代償評分

(汽車貸)汽車金融評分

4.1.3.3 基於開發邏輯

(經驗)經驗驅動評分

(技術)統計驅動評分

(技術)機器學習評分

(技術)深度學習評分

4.1.3.4 基於生命週期

(售前)營銷響應評分

(貸前)欺詐風險識別

(貸前)信用風險識別

(貸中)貸中行爲評分

(貸中)額度管理評分

(貸後)失聯預測評分

(貸後)償債能力評分

申請准入分:申請准入置信度 申請命中查詢機構數 申請命中消費金融類機構數 申請命中網絡貸款類機構數 機構總查詢次數 最近一次機構查詢時間 近1個月貸款類機構總查詢筆數 近3個月貸款類機構總查詢筆數 近6個月貸款類機構總查詢筆數

貸款行爲分:貸款行爲置信度 貸款放款總訂單數 貸款已結清訂單數 貸款逾期訂單數(M1) 命中貸款放款機構數 命中消費金融類機構數 命中網絡貸款類機構數 近1個月貸款機構放款筆數 近3個月貸款機構放款筆數 近6個月貸款機構放款筆數 歷史貸款機構成功扣款筆數 歷史貸款機構失敗扣款筆數 近1個月貸款機構成功扣款筆數 近1個月貸款機構失敗扣款筆數 信用貸款時長 最近一次貸款放款時間

信用現狀:建議授信額度 建議額度置信度 命中在用的網絡貸款類機構數 命中在用的網絡貸款類產品數 網絡貸款機構最大授信額度 網絡貸款機構平均授信額度 命中在用的消費金融類機構數 命中在用的消費金融類產品數 消費金融類機構最大授信額度 消費金融類機構平均授信額度

評分區間

0~10

0~100

350~850

評分等級

A、B、C、D、E

一級、二級、三級、四級、五級

4.1.4 行爲明細類

部分數據特徵需求。

4.1.4.1 徵信查詢記錄

查詢原因:

貸款審批、貸後管理、信用卡審批、擔保資格審查、保前審查。

按查詢主鍵:按身份證號查詢,按手機號查詢

按申請主體

近3月查詢筆數

被查詢人的真實姓名

被查詢人的身份證號碼僅支持18位身份證

發起查詢請求公司的代碼

4.1.4.2 借貸交易記錄

包含歷史上平臺查詢此借款人的機構名稱、查詢時間、機構類型、查詢原因、借款記錄歷史、提供數據的機構代號、被查詢借款人姓名、被查詢借款人身份證號、借款時間、借款期數、借款金額、審批結果 、還款狀態、借款類型、逾期金額、逾期情況、歷史逾期總次數、歷史逾期M3+次數、歷史逾期M6+次數。

多頭借貸

多頭的情況,即在多家非銀機構中申請的貸款的情況,包括:多頭申請、多頭拒貸、多頭放款、多頭逾期、信用狀態/負債報告等。按照多頭的時間維度可以細分爲:近7天;近15天;近1個月-最近30天;近3個月-最近90天;近6個月-最近180天;最近最早申請記錄。

按統計單位:申請次數,連續申請次數,申請機構數

按申請時間:近6月,近12月,夜間申請,週末申請,申請間隔天數,連續申請的持續天數,最小間隔天數,最大間隔天數,有申請記錄月份數,平均每月申請(有申請月份平均)

近n個月:頻繁申請;拒貸較多;電話失聯;已結案;逾期還清;逾期中;執行中;終本案件。

多頭報告

註冊機構數量 註冊機構數(去重)

註冊機構類型 輸入信息的註冊機類型(去重)

第三方渠道註冊機構數量 第三方來源授權多頭(去重)

機構查詢次數 機構查詢次數(不去重)

機構類型 註冊機類型

近n天貸款申請次數 近n天申請該機構類型貸款的次數

查詢日期 該用戶被查詢的日期

機構類型 該用戶被查詢的機構的類型

是否本機構查詢 是否爲本機構查詢:是/否

借貸機構數(去重) 放貸的機構數(去重)

借貸次數 放貸的次數

近n天貸款的機構數 近n天放貸的機構數(去重)

近n天貸款的次數 近n天放貸的次數

還有如借款金額;借款時間;還款狀態;借款類型碼;被查詢借款人姓名;逾期金額;歷史M3+逾期次數;歷史M6+逾期次數;逾期情況;歷史逾期總次數;期數;風險明細;命中項碼;命中內容;風險最近時間等。

4.1.4.3 逾期歷史記錄

判斷手機、姓名、身份證是否在黑名單;灰名單;灰名單更新時間。以及逾期次數;最大逾期金額;最大逾期天數。

逾期類型:法院-被執行;近期存在多頭申請風險;模型評估低資質;小額業務拖欠;長期拖欠

是否拉黑:判斷是否拉黑,瞭解拉黑明細

是否白戶:查不到用戶相關數據

逾期未還款行爲:當前存在逾期未還款行爲

最大逾期金額:用戶借款並未按時還款的最大金額

最長逾期天數:用戶最長逾期天數

最近逾期時間:用戶最近逾期的時間

當前逾期機構數:截止查詢時間,用戶產生逾期的全部機構個數

當前履約機構數:截止查詢時間,用戶正常還款的全部機構個數

異常還款機構數:截止查詢時間,用戶最後交易行爲銀行卡註銷、掛失等高危行爲的機構個數

睡眠機構數:截止查詢時間,用戶6個月內無交易記錄的機構數

4.1.5 畫像報告類

報告可以理解爲較爲完整的數據字典。

4.1.5.1 人行徵信報告

人行徵信報告編號

用戶姓名

證件類型:如身份證等

證件號碼:人行徵信報告中證件號碼是不全的。

用戶申請人行徵信報告的時間,人行徵信報告的生成時間

婚姻狀態:

信貸記錄

賬戶類型:1.信用卡 2.住房貸款 3.其它貸款

賬戶數:’未結清、未銷戶賬戶數;發生過逾期的賬戶數;發生過90天以上逾期的賬戶數 爲他人擔保筆數

信貸類型:1.信用卡 2.住房貸款 3.其它貸款

賬戶類型:1.發生過逾期的貸記卡賬戶 2.從未逾期過的貸記卡及透支未超過60天的準貸記卡賬戶 3.從未逾期過的賬戶 4.透支超過60天的準貸記卡賬戶 5.發生過逾期的賬戶

賬戶明細:記錄了該賬戶是否逾期, 銷戶等情況

公共記錄

公共記錄類型: 1.欠稅記錄 2.民事判決記錄 3.強制執行記錄 4.行政處罰記錄 5.電信欠費記錄

公共記錄明細:** **

查詢記錄

查詢時間:

查詢操作員:

查詢原因:信用卡審批 , 貸後管理 , 貸款審批 ,本人查詢

信用卡記錄詳細信息

信用卡發放的時間

發放信用卡銀行的名稱

信用卡類型 包括: 貸記卡, 準貸記卡;

賬戶的幣種 包括: 人民幣賬戶, 美元賬戶

本徵信報告獲取本信用卡信息的最後時間 如果該賬戶已銷戶,則表示銷戶時間

信用額度 單位爲人民幣, 如果是美元賬戶, 信用額度是摺合人民幣的額度。

已使用額度 貸記卡賬戶爲信用額度

透支餘額 準貸記卡賬戶爲透支餘額

是否激活過

是否已銷戶

是否有逾期記錄

有過逾期記錄的月數

準貸記卡賬戶是否有大於60天逾期記錄

準記卡賬戶有超過60天逾期記錄月數

該賬戶是否有超過90天

該賬戶有超過90天逾期記錄月數

購房貸款記錄

貸款發放的時間

發放貸款銀行的名稱

貸款幣種 人民幣

購房貸款總金額

貸款對象 包括個人住房貸款,個人商用房(包括商住兩用)貸款和個人住房公積金貸款。

購房貸款到期日

本徵信報告獲取本該購房貸款信息的最後時間 如果已結清,則是是結清時間

購房貸款是否已結清

購房貸款餘額

購房貸款是否有逾期

購房貸款有逾期的月數

購房貸款是否有超過90天的逾期

購房逾期超過90天的月數

4.1.5.2 運營商報告

身份證號歸屬地

手機號碼歸屬地

手機運營商

一階聯繫人黑名單個數 借款人的一階聯繫人中,被認定爲黑名單的個數/人數

一階聯繫人逾期個數 借款人的一階聯繫人中,借款發生逾期的個數/人數

一階聯繫人逾期m3+個數 借款人的一階聯繫人中,歷史逾期天數大於等於90天,包含逾期還清

一階聯繫人黑名單數佔比

一階聯繫人逾期佔比

二階聯繫人黑名單個數 借款人的二階聯繫人中,被認定爲黑名單的個數/人數

二階聯繫人逾期個數 借款人的二階聯繫人中,借款發生逾期的個數/人數

二階聯繫人逾期m3+個數 借款人的二階聯繫人中,歷史逾期天數大於等於90天,包含逾期還清

主叫聯繫人數 主叫聯繫人數

主叫聯繫人黑名單個數 主叫聯繫人中,被認定爲黑名單的人數

主叫聯繫人逾期個數 主叫聯繫人中,當前逾期天數大於等於4天

夜間通話人數

夜間通話次數

夜間通話秒數

與虛擬號碼通話人數、次數、秒數

異地通話人數、次數、秒數

與澳門通話人數、次數、秒數

與銀行或同行通話總次數

與銀行或同行通話總秒數

與法院通話次數

與律師通話次數

夜間通話 24點到5點

一階聯繫人 與借款人本人直接聯繫的聯繫人,即借款人的一度關聯人

二階聯繫人 與一階聯繫人直接聯繫的聯繫認,即借款人的二度關聯人

一階聯繫人黑名單個數 借款人的一階聯繫人中,被認定爲黑名單的個數/人數

一階聯繫人逾期個數 借款人的一階聯繫人中,借款發生逾期的個數/人數

主叫聯繫人 借款人主動撥打的聯繫人

“逾期”的判定標準 當前逾期,且逾期≥4天

“逾期M3+”的判定標準 曾經逾期,且逾期≥90天,包含逾期還清

4.1.5.3 銀聯消費報告

銀聯智策失敗交易查詢

銀行卡卡號

debit代表借記卡,"credit"代表信用卡

卡使用狀態

客戶等級:不活躍客戶、長期忠誠客戶、活躍上升客戶、活躍下降客戶、自激活或新客戶、睡眠客戶

衡量持卡人套現風險

衡量持卡人是否合理使用資金

持卡人價值

消費習慣,財富水平

逾期風險

消費穩定性

跨境傾向

累加消費金額、最大消費金額、最小消費金額、累計交易金額/交易筆數。

近n個月發生批發類交易、餐飲交易、倉儲超市、批發交易、儲蓄交易、取現交易、跨境交易、轉出交易、轉入交易、週末交易、衛生類交易金額之和

持卡人劃卡次數很少,用卡商戶類型,總交易金額,刷卡消費穩定性,用卡範圍

4.1.5.4 電商消費報告

月消費金額

非生活必需品消費類金額(含奢侈品、SPA、運動類、圖書類等)

生活必需品消費類金額(餐飲消費等)

境外消費類總金額

嬰幼兒消費總金額

車輛類消費總金額

是否命中購房記錄

是否命中否購車

常用消費城市

常用消費時間段

月均消費金額

銀行卡覈驗結果

非生活必需品消費

生活必需品消費金額

境外消費總金額

嬰幼兒消費總金額

是否命中購房記錄

是否命中購車記錄

常用消費城市

常用消費時段

4.1.5.5 出行消費報告

非常用地消費總金額

航旅出行頻率評估

高鐵出行頻率評估

最頻繁出行地點

工作時段(早9-晚5)地區

休息時段(晚00:00-早5:00)地區

常用地消費金額

常用消費城市

常用消費時間段

航空出行報告

乘機次數

國內次數

平均國內票價、折扣

國際次數

平均國際票價

最愛航司前三名

最愛航司次數1-3

最愛目的地1-3

最愛目的地次數1-3

國內頭等、商務、經濟次數

平均延誤分鐘數

延誤次數(大於30分鐘)

大、小飛機次數

4.1.5.6 設備畫像

設備環境風險:設備環境風險,判定設備使用代理、模擬器、修改設備參數等一些特徵。

設備行爲畫像:設備行爲信息,反應設備歷史行爲信息。

設備實名關聯:設備實名關聯,設備和實名信息關聯及驗證。

設備應用偏好:設備應用偏好,設備APP安裝情況分析。

設備羣體欺詐:設備羣體欺詐,識別設備是否具有羣體欺詐風險。

設備特殊名單:通過設備查詢用戶及其社交關係是否命中設備特殊名單庫的統計評估。

設備採集數據:設備信息採集產品查詢設備全局信息,返回給客戶通過設備標示查詢到的關於設備和用戶的信息。

4.2 明確需求

建議:回顧第二節數據應用邏輯關於業務類型、風險類型、風控流程、風險畫像等的介紹。

準確性高、穩定性強、吞吐量大、擴展性強

穩定、合規、安全、可靠

4.2.1 場景需求

貸前審覈、貸中監控、授信策略等。

產品、週期、件均等。

4.2.2 功能需求

產品類別:通用分數、定製分數,某種畫像的評分,或者綜合評分

覆蓋度;準確性;顆粒度;時效性;無污染性:

數據真實:數據源真實可靠,數據內容未經篡改或加工;

信息準確:數據解析準確,不出現亂碼、錯位、錯值、空值等數據錯誤;

持續穩定:數據共贏穩定、持續,不可出現可引起業務停滯的重大服務中斷事故;

覆蓋完善:所供數據覆蓋範圍完整,數據完備程度高,可製成業務決策;

更新及時:數據返回時間、數據更新時間複覈金融機構業務需求,數據及時有效

4.2.3 合作形式

合作方式;合作週期;價格等。

日調用,月調用,熱點量,

計費方式、計算方式,費用

返回結果,評分+額度

4.3 合作對接

調研、採集、接入、加工、分析、決策,完整的工作流的形式去做選擇。

4.3.1 相關資質

4.3.1.1 企業安全

企業資質;業務連續性;合規安全性等。

4.3.1.2 數據安全

目前在大數據的應用上依舊會保持着嚴厲的監管,合規合法是趨勢。怎麼樣的行爲屬於合規合法的?授權是前提,必須明確寫明授權機構和授權使用場景;除此之外,避免接觸到敏感信息,通過評分代替直接數據交互。這幾個都是核心的關鍵點。

目前對數據敏感性的處理上,更有聯邦學習會對數據建模迭代過程進行加密,比聯合建模更能規避數據隱私、合規性等問題。聯邦學習雖然目前落地的場景還有待加強,但未來的趨勢數據合規肯定是趨勢,破除數據孤島也應該成爲必然,

4.3.1.3 形式安全

評分、名單、數據、畫像

4.3.2 相關協議

4.3.2.1 保密協議

本次合作數據方面的保密性

4.3.2.2 承諾書

場景的真實性合規性

用戶授權的完整性

4.3.2.3 銷售協議

4.3.3 相關報價

按查詢計費:用戶授權登錄成功後,有核驗結果返回則計費,查有則計費

按查得計費:

按操作計費:數據比對完成並返回結果則計費

按比中計費:

按時間計費:

4.4 離線批量測試

4.4.1 測試樣本準備

由甲方根據雙方約定準備測試數據。

4.4.1.1 測試數據量

名單類:1k~5k

評分類:5k~2w

標籤類:1k~5k

報告類:樣例

4.4.1.2 查詢主鍵

一要素:手機號

二要素:手機號、身份證號

三要素:姓名、手機號、身份證號

四要素:姓名、手機號、身份證號、銀行卡號

4.4.1.3 回溯時間

測試前通常需要雙方根據樣本時間和乙方庫存支持時間溝通回溯時間需求,目的在於還原用戶借款時的數據情況,還可以支持樣本分層、分羣、分區、分段,從而細化分析。

4.4.1.4 注意事項

數據格式:最好清晰一致,避免出現重複、異常、缺失數據以及格式亂等問題。

數據加密:數據多用md532位小寫方式加密,文件多爲excel或csv文件格式,文件傳輸設置密碼,只同步部分核心人員。

發送方式:郵件正式發送,且有備份;系統平臺導入,較爲正式嚴謹。

4.4.2 乙方數據報告

由乙方根據雙方約定開始提取相關數據並進行初步分析。包括數據明細反饋、初步覆蓋率,結果分佈情況以及一些其他方面的說明和建議。

4.4.2.1 結果反饋

週期:135個工作日

形式:數據報告

4.4.2.2 報告樣例

由乙方給出初步的數據多維度評估,報告內容通常由以下幾部分組成:

匹配情況:撞庫之後的身份證或者手機號匹配率。

覆蓋情況:有效名單、評分、數據覆蓋情況。

缺失情況:獲取到的數據缺失類別及缺失程度是否嚴重。

命中情況:名單命中率。

分佈情況:名單分類比,評分分佈情況。

異常情況:是否有異常數據生成。

4.4.3 甲方測試報告

由甲方根據數據標籤匹配結果及數據有效性給予數據測試分析報告。既可以反饋測試結果好壞,也有利於雙方在合作上的進一步探討。報告內容通常由以下幾部分組成:測試效果;排序性:區分度:區間區分度;穩定性;區間穩定性:一致性**。**

4.4.3.1 名單類數據性能驗證

混淆矩陣

查得率(Search rate)=查得數/樣本量

覆蓋率(Cover rate)=查得命中黑名單數/樣本中命中黑名單量

誤拒率(Error reject rate)=查得命中黑名單數/樣本中通過且爲Good量

有效差異率(Effective difference rate)=查得命中黑名單數/樣本中通過且Bad量

無效差異率(Invalid difference rate)=查得命中黑名單數/樣本中其他拒絕量

更爲詳細的三方數據測試方法,可參考:如何選擇合適的第三方數據源

4.4.3.2 評分類數據性能驗證

a) K-S值:Kolmogorov-Smirnov Statistic值,K-S值指的是“好”客戶和“壞”客戶累計分佈比例之間距離的最大值。K-S值重點衡量的是某一個分數點的區分能力。

如下圖所示:

圖片

K-S值參考範圍:

K-S值 模型表現
<0.2
0.2~0.4 一般
0.4~0.5
0.5~0.6 很好
0.6-0.75 非常好
0.75~1 非常完美

b) ROC曲線:ROC曲線又稱接受者操作特性曲線,可以用來評估評分類數據的區分能力,權衡曲線下面的面積(AUC)越大說明評分類數據的區分能力越強。在完全隨機選擇的情況下AUC=0.5,AUC大於0.5,說明評分類數據選擇的效果優於隨機選擇的效果,一般來說,如果評分類數據的AUC大於0.7則被認爲是可以接受的。如下圖所示:

圖片

c)GINI係數:基尼係數越大說明評分類數據的區分能力越強。GINI係數可以通過如下公式進行轉化:

GINI=2*(AUC-0.5)

基尼係數(GINI)參考範圍:

基尼係數 模型表現
<0.4 一般
0.4~0.6
0.6~0.8 很好
0.8~0.9 非常好
0.9~1.0 非常完美

d)好/壞比圖表

如下表所示,好/壞比圖表可以用來驗證評分數據的排序性能。即判斷好/壞比是不是隨着評分的升高而上升的。

好/壞比參考表(示例)

組序 組別 總數 好客戶數 好客戶數佔比 壞客戶數 壞客戶數佔比 好壞比
1 0-499 1669 1251 75.0% 418 25.0% 3.0
2 500-549 1622 1323 81.6% 299 18.4% 4.4
3 550-599 3062 2565 83.8% 497 16.2% 5.2
4 600-649 7644 6758 88.4% 886 11.6% 7.6
5 650-699 20277 18794 92.7% 1483 7.3% 12.7
6 700-749 43424 40676 93.7% 2748 6.3% 14.8
7 750-799 94696 90378 95.4% 4318 4.6% 20.9
8 800-849 163740 159855 97.6% 3885 2.4% 41.1
9 850-899 137122 135490 98.8% 1632 1.2% 83.0
10 900-949 66173 65701 99.3% 472 0.7% 139.2
11 950-999 7465 7433 99.6% 32 0.4% 232.3

e**)**** **區分度:區分度又稱分離度。區分度刻畫了評分類數據對“好/壞”進行區分的能力,其主要影響因素爲“好”客戶和“壞”客戶分佈的分離程度和重疊程度。區分度越高、重疊度越低,評分類數據預測誤差越小。

圖片

圖片

f**) PSI羣體穩定性指標**:PSI羣體穩定性指標(population stability index)主要考察的是不同時間評分類數據分佈是否發生了變化。當羣體穩定性指標顯示客羣的評分類數據分佈發生了較大變化時,需要通過進一步的分析來找出客羣發生變化的原因。如下表所示,以2015年羣體分數分佈爲基準計算:

羣體穩定性指標計算參考表(示例)

分數分組 2015年 2015年% 2016年 2016年% PSI
** ** (A) ** ** (B) ©=(A)-(B) (D)=LN((A)/(B)) (E)=©*(D)
0-499 1616 0% 53 0% 0% 0.70 0.0011
500-549 1590 0% 32 0% 0% 1.19 0.0026
550-599 2960 1% 102 0% 0% 0.65 0.0018
600-649 7380 1% 264 1% 1% 0.61 0.0040
650-699 19596 4% 681 2% 2% 0.64 0.0116
700-749 41390 8% 2034 6% 2% 0.29 0.0060
750-799 87946 17% 6750 20% -3% -0.15 0.0043
800-849 153244 30% 10496 31% -1% -0.04 0.0004
850-899 128769 25% 8353 25% 0% 0.02 0.0001
900-949 61653 12% 4520 13% -1% -0.11 0.0014
950-999 6928 1% 537 2% 0% -0.16 0.0004
合計 513072 100% 33822 100% 0.033671

羣體穩定性指標計算公式如下:

psi = sum((實際佔比-預期佔比)/ln(實際佔比/預期佔比))

基準的選擇沒有統一的標準,一般來說選擇評分類數據性能表現相對較好的時點作爲參考基準點。羣體穩定性指標(PSI)參考範圍:

** 羣體穩定性指標** ** 客戶羣體特徵**
<0.1 無關緊要的變化
0.1~0.25 發生了較小變化
>0.25 發生了較大變化

4.4.3.3 評分類數據應用驗證

a)覆蓋率

覆蓋率是指數據的查得率,主要考察驗證機構查詢請求客戶中有多少比例的客戶返回了數據。舉例來說,如果驗證機構提交了100萬客戶的數據查詢請求,數據服務商返回了80萬客戶的數據,則數據的覆蓋率爲80%。

計算不同申請時點的覆蓋率,重點觀察有沒有在特定時點的覆蓋率非常低。若有,則需分析是否因放貸機構在該時點授信政策等的變化導致客戶羣發生變化。在此基礎上,計算樣本人羣的總體覆蓋率。一般來說,覆蓋率越高,數據在驗證機構的可應用性就越強。

覆蓋率計算表(示例)

申請時點 查詢請求數 有效返回數 覆蓋率
2015.3 1000 800 80%
2015.6 9000 8999 99%
2015.9 10000 7000 70%
2015.12 5000 4000 80%
2016.6 30000 10000 33%
2016.12 2000 1000 50%

b)貸前應用驗證

貸前審批環節對評分數據的應用驗證,主要通過將加入評分數據策略後申請通過客戶與原審批策略下通過客戶進行對比,觀察在加入評分數據後能不能提升通過客戶風險質量或者擴大通過客戶規模。

例如,驗證機構計算原有的貸前策略通過率來確定評分數據相應的分數線,使該分數線對應的通過率與原貸前策略通過率保持一致;對比兩種不同策略情況下不良率的高低,如果使用評分數據對應的不良率小於使用原策略對應的不良率則說明該評分數據策略優於原策略。也可確定一條分數線使該分數線對應的不良率等於原貸前策略實際不良率,對比兩種不同策略情況下通過率的高低。

c)貸後管理應用驗證

貸後環節對評分數據的應用主要爲風險預警,驗證機構可以通過對評分數據的連續跟蹤,觀察評分數據較低或者短時間內發生顯著變化的人羣和其表現是否有關係,如果相關性很強,則可嘗試利用評分數據作爲風險預警的條件。

例如可以統計一個月內分數下降的幅度,對應在未來出現“壞”的比率。如下表示例所示:

分數下降區間 未來6個月不發生逾期30+ 未來6個月發生逾期30+ 合計 未來6個月發生逾期30+佔比
1-49 10956 1427 12383 11.5%
50-99 2064 602 2666 22.6%
100-149 787 525 1312 40.0%
150-199 232 255 487 52.4%
>200 42 56 98 57.1%

d)催收管理應用驗證

評分數據在催收管理中應用的驗證方法主要爲分析評分數據與遞延率之間的相關性。驗證機構對此應用方式進行驗證時,可以首先計算評分數據在不同逾期等級客戶上的區分能力。在此基礎上計算完成逾期客戶的遞延率表。

總結:不同的評分數據需要進行的應用驗證是要根據評分數據的類型來決定的。從評分類數據適用的實際業務場景出發,挑選場景中合適的樣本進行選擇性的驗證。

4.5 在線接口測試

4.5.1 接入規範

概述

適用範圍

調用過程

報文主體

報文內容,報文頭

請求,響應

4.5.2 相關文檔

4.5.2.1 產品文檔

接口類型

異步查詢接口

異步結果反饋接口

查詢同步接口

查詢記錄獲取接口

借貸查詢接口

借貸共享接口

4.5.2.2 接口文檔

包括:調用方式;參數格式;接口詳情;報文示例;輸出參數;報文示例等。

4.5.3 綜合測試

壓力測試;異常測試等。

4.5.4 常見問題

4.5.4.1 結果碼

-3 無查詢權限;-2 查詢失敗;-1 未查詢;0 查無此記錄;2 不一致;3 一致

4.5.4.2 等級碼

1 一級、2 二級、3 三級、4 四級、5 五級

4.5.4.3 錯誤碼

0000 成功

0001 查詢成功但無數據

0005 查詢機構接收數據成功

1001 當日查詢達到上限

1002 服務器繁忙

4001 用戶名解密出現異常

4002 參數解密出現異常

4005 請求的接口不存在

4006 字符集解碼失敗

4008 輸入的參數部分格式不正確,需json格式

4009 用戶調用參數不正確

4011 參數長度不正確

4012 傳入的參數存在空值

4100 超出機構單次身份證號上傳上限

4101 API用戶不存在

4102 用戶已停用

4104 用戶所在機構已停用

4105 查詢數量已全部用完,如需添加請聯繫客服

4106 沒有查詢該API的權限

4107 IP 地址無權限

4108 用戶沒有查詢權限

4110 查詢人次已全部用完,如需添加請聯繫客服

4111 超過API訪問頻次限制,請稍後再試

4112 無效的簽名,請開發者檢驗簽名的正確性

4200 參數錯誤

5000 出現系統錯誤,需要檢查錯誤日誌

7001 無此進件

4.6 生產環境調用

4.6.1 運行監測

調用量;調用異常;統計異常等。

4.6.2 問題彙總

重複調用問題;熱點性問題等。

引用參考

【書籍】《信用評分工具:自動化信用管理的理論與實踐》

【資料】巴塞爾協議

【文章】數據上升爲生產要素地位,國外數據政策趨勢帶給我們哪些啓示? ​https://mp.weixin.qq.com/s/6RKNd5ujeM_LSltRda1f4A

【文章】人行二代個人徵信及變量衍生深度解讀https://mp.weixin.qq.com/s/ZKw__9BVlnI9O96PiJNapw

【文章】百行徵信揭祕字段中間找關係https://mp.weixin.qq.com/s/82BpfNjc_vy4gpgV_oxPig

【文章】如何選擇合適的第三方數據源


推薦閱讀

【文章】徵信報告策略詳解

【文章】哪家數據供應商的數據好用?

【文章】關於供應商數據測試的那些事

【文章】番茄風控大數據-談談互金跟銀行裏數據邏輯的差異

【文章】番茄風控大數據-銀行數據部門如何管理跟使用數據?

【文章】番茄風控大數據-數據回溯,數據分析師的必備技能

【文章】番茄風控大數據-談談信貸的風險標籤

【文章】番茄風控大數據-風控應該知道的冷啓動


這裏是正陽能量場, 很高興能通過文字認識你,點個關注,後會有期。

【其他文章】

(一)全面瞭解小微信貸風控

(二)全面瞭解風控決策引擎

(三)全面瞭解信貸業務流程

(四)全面瞭解量化風險管理

(五)全面瞭解風控指標體系

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章