信用評分模型python實踐——簡介

由於之前進行過信用評分模型的學習,並且接觸並實踐了一小段時間,雖然已經過了一年了,但是爲了讓這一段經歷能夠保留,在這裏記錄下點滴。本次將分多篇文章對信用評分模型的python實踐進行闡述,包括簡介,概念以及最後的代碼實現。最後很高興看這一系列的朋友們,也希望能幫到你,大家一起學習。

信用評分模型簡介

信用評分模型運用數據挖掘技術和統計分析方法,通過對客戶的人口特徵、信用歷史記錄、行爲記錄、交易記錄等大量數據進行系統的分析,挖掘出數據中蘊涵的行爲模式、捕捉歷史信息和未來信用表現之間的關係,發展出預測性的模型,以一個信用評分(credit score)來綜合評估客戶未來的信用表現。 

通過信用評分模型,銀行計算出用戶的信用評分,而此信用評分表示該用戶的風險程度,評分的高低按照風險概率的大小進行排列,分數越高,風險越低;分數越低,風險越高。

模型類型

如今在銀行,P2P等各種貸款業務機構,普遍使用信用評分,信用評分卡大致可以分A,B,C卡三類。

  • A卡(Application score card)申請評分卡

  • B卡(Behavior score card)行爲評分卡

  • C卡(Collection score card)催收評分卡

三種卡的介紹,請直接看這篇文章:比較全面的說了三種打分機制。樑世棟博士的《行爲評分和貸後風險管理研究》http://www.docin.com/p-516772778.html

本文中將三個階段進行了進一步的細化,分成以下模型

 第三方徵信

除了人行老大徵信,以及各大銀行自己的徵信策略,隨着互聯網的如火如荼,各大互聯網大佬們也推出了各自的徵信系統,大家最熟悉的螞蟻金服的芝麻徵信,已經滲透到生活的方方面面,比如最近揹負舉債人人喊打的小黃車ofo,當年可以是推出了信用免押金模式(我的押金還在一千多萬排名呢😢),還有京東的小白信用等。

芝麻信用

通過雲計算、機器學習等技術客觀呈現個人的信用狀況,已經在信用卡、消費金融、酒店、租房、出行、婚戀、分類信息、學生服務、公共事業服務等上百個場景爲用戶、商戶提供信用服務。

京東信用

主要從身份(社會屬性、居住環境、教育情況和穩定性),資產(金融投資、信用能力和收支情況),偏好(登錄、瀏覽、下單等維度),履約(金融產品、電商平臺和社會行爲中表現出來的履約和違約情況)和關係(社會關係和購物行爲)來考量。

騰訊信用

是騰訊徵信推出的個人徵信管理平臺,騰訊信用主要基於歷史行爲信息,通過採集不同維度的信息,運用大數據,機器學習以及傳統統計方法相結合的技術手段來客觀的反映用戶的信用水平,從而得出用戶的守信指數,用信用分來反映用戶的信用水平,分數的多少是通過專業、先進的信用評分模型評估得出的,分數越高代表信用水平越高。

模型時間線

和其他模型非常大不同,信用評分模型是一個漫長的過程,這就需要企業捨得花時間和精力去做了,目前也就是隻有銀行和互聯網大佬有時間精力能力以及數據去做這件事情。我們通常分爲觀察期和表現期

  • 觀察期:收集信用歷史信息和行爲特徵等,可以認爲就是特徵
  • 表現期:即這次信用評分模型等目標,收集信用表現的信息,比如是否在這幾個月內有拖欠,收益高低,卡是否被強停,是否有違約

 具體觀察期和表現期的時間要根據模型而定,比如申請風險評分模型時間就較短,其實也很好理解,申請嘛,還沒成爲你的客戶,而且現在正是獲客,佔領市場的關鍵時期,所以相對嚴格度會低一點。但是行爲評分模型時間就更長一點,路遙知馬力,日久見人心,好好觀察後,才能對你進行評判,想想我們辦事,處對象也是如此,😊。

模型特徵

這裏我就舉行爲模型常用的客戶特徵,如下表所示,不同模型的側重點也不一樣。

消費行爲:最近3個月消費金額、消費筆數,最近3期境外消費金額佔比,最近3期網銀消費筆數 等

還款行爲:最近3個月最大逾期天數、還款率、逾期還款期數,最近6個期賬戶逾期月數,最近12個月未欠款賬單數 等

賬戶屬性:信用額度,開卡時間,收益率、髮卡機構 等

客戶屬性:年齡,收入,性別,戶籍狀態 等

 

信用評分模型的介紹先到這,可能說的比較簡單,先讓大家感受感受一下這類模型的特點,從下一節開始,我們將闡述信用模型涉及到的一些數學理論概念等,並進行python實踐,大家一起加油吧,😄。

 

對了,推薦一本信用評分模型等入門書籍《信用評分模型技術與應用》。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章