在反欺詐場景中,知識圖譜聚合各類數據源,逐步繪製出借款人的profile,從而針對性的識別欺詐風險。以一個借款人舉例,借款人可以有身份證號,手機號,學歷等個人信息,屬於個人的屬性信息;而借款人可以有擔保人或是親屬好友,借款人與擔保人之間的關係(也就是邊Edge)是被擔保與擔保的關係,借款人與其親屬好友之間的關係是父親、母親、同事、同學等關係;借款人也具有住址,銀行流水,工作單位等信息。這些信息可以來自於多個渠道,例如可以由借款人自己填寫,或是積累的歷史數據,或是數據提供商提供,或是在互聯網上獲得,甚至通過推理得到,往往具有冗餘性;信息通過圖的形式連結,展示出借款人的profile。
1識別數據造假
當融合來自不同數據源的信息構成知識圖譜時,有一些實體會同時屬於兩個互斥的類別(例如同時在兩個不同的城市工作),或某個實體所對應的一個Property(同一個人的住址)對應多個值,這樣就會出現不一致性,這個不一致性即可判定爲潛在的可疑點。 通過這種不一致性檢測,我們利用繪製出的知識圖譜可以識別潛在的欺詐風險。在P2P行業,欺詐風險主要的騙術包括個人信息造假、工作單位虛假、代辦包裝、虛假聯繫人、組團騙貸等。以識別數據造假爲例,利用知識圖譜我們可以通過借款人的身份信息PII(Personal Identify Information),例如手機號或是身份證號,直接索引到個人的全部信息,並以此與借款人的填寫信息進行不一致性檢測;也可以通過借款人的其他信息進行推理出其相關信息進行驗證,舉一個例子,我們可以通過借款人的身份證號和姓名可以獲得他的學歷信息和年齡,通過學歷信息和年齡可以推算出其工作年限,再根據其所在城市,行業,職位,結合互聯網上的招聘網站數據推理出其薪水範圍,進而驗證他的收入水平;甚至可以通過不同借款人之間的同事關係,驗證其工作單位的真假。
2組團欺詐和代辦包裝
除了對數據造假進行驗證外,由於圖結構帶來的天然關聯檢索的特點,知識圖譜可以識別潛在的代辦包裝或是組團騙貸。我們利用徵信公司提供的欺詐數據,擁有的代辦包裝公司數據,互聯網公開欺詐黑名單,行業黑名單聯盟等數據開發大量的標籤數據,對實體(包括公司和人)貼上標籤,例如逾期,虛假手機號,代辦包裝或是組團騙貸等標籤,當借款人進行申請貸款時,如果我們發現他和bad people/company/info具有較多的關聯關係,那麼這個人有很大的可能是欺詐,從而識別出風險。 與搜索引擎的場景不同,知識圖譜在反欺詐場景中具有較低的應用門檻,數據量較少時也可以進行低程度的交叉驗證,而隨着數據量的積累和增多,知識圖譜也會越來越完善,其反欺詐能力也會越來越強。我們建立大數據反欺詐系統,在借款人提交借款申請開始即介入整個風控流程,對接多個數據源以獲取借款人的數據信息,在各個環節建立checkpoint,通過可配置的規則引擎在各個checkpoint執行預定的邏輯,識別和防禦欺詐風險。
3.反欺詐模型設計
first
通過社交 (同學圈,同事圈,親戚圈),手機通訊錄 評判
second
1 從用戶申請提交的數據層面
· 1.1年齡和學歷與收入不符合。 · 1.2通訊錄無直屬親人。 · 1.3擁有資產如車、房等與居住地址 或消費水平不符合。 · 1.4現住地址與公司地址差異較大。如不在同一城市中。 · 1.5QQ或APP最近常登陸地區不在現 住地址或公司地址中。 · 1.6最近手機通訊地址不在常用地址 中 · 1.7收貨信息上手機號碼與通訊錄上 手機號碼反差較大
2 申請的記錄在已有的記錄有類似出現
· 2.1電話號碼出現在已有放貸或申請記錄中 · 2.2身份證號碼出現在已有放貸或申請記錄中 · 2.3地址出現在已有放貸或申請記錄中 · 2.4QQ號碼在已有放貸或申請記錄中 · 2.5同一郵箱已有放貸或申請記錄 · 2.6銀行卡號在已有放貸或申請記錄中 · 2.7同一車牌號在已有放貸或申請記錄中
3 黑名單 徵信
· 3.1 貸聯盟公佈黑名單 · 3.2 人行徵信黑名單 · 3.3 徵信是否有逾期
4 操作
· 4.1 單個IP,多次申請賬號 • 單個MAC,多次申請賬號 · 4.2 同一賬號,短時間登陸多個地域相差大的IP · 4.3單個IP,多次申請貸款 · 4.4 單個MAC,多次申請貸款 · 4.5 同一賬號,短時間內申請貸款數量或金額超過一定限制 · 4.6 同一關係圈,出現相似借貸 --------------------- 作者:陶瑞同學 來源:CSDN 原文:https://blog.csdn.net/qq_30262201/article/details/78809558 版權聲明:本文爲博主原創文章,轉載請附上博文鏈接!
轉載地址: http://www.sohu.com/a/162012568_470081 關於IP的一些冷知識: IP地址(本文中特指IPv4地址),是用於標識網絡和主機的一種邏輯標識。依託於強大的TCP/IP協議,使得我們可以憑
實時反欺詐建設路徑及實踐 1. 實時反欺詐體系 1. 事前:可信環境構建及識別 可信環境: 可信設備 可信賬戶 可信位置(IP,GPS等) 2. 事中:監控策略體系 規則監控 案件規則 規則模板 規則訓練 模型監控
電信網絡詐騙犯罪情況介紹 來源:北京公安局反詐騙中心 1. 總體情況及特點 2018年全國刑事立案同比下降7.7%,但電信網絡詐騙立案數上升30%,形勢嚴峻; 犯罪類型多,手段變化快; 被騙羣體廣,社會危害大; 灰
在信貸風控中,指標時反應業務變化最直觀的手段,通過對指標的分析及時發現和定位業務開展過程中的問題,並及時採取相應的手段進行防控。本文列出工作中常關注的風險指標,介紹指標的定義及分析的方法,旨在精而不在全,希望能對各位讀者有一
目錄: 1.額度矩陣 2.單風險因子 3.多風險因子 4.額度授予模型 風控策略主要是根據不同業務場景,針對特定性質的客羣,通過一系列規則的並聯、串聯以及排序組合,來對客戶進行篩選和分類,實現反欺詐、授信、風險定價、催收的各
Python中信貸評分卡中常用的兩個庫有scorecardpy和Toad。其中scorecardpy是由謝士晨博士開發,Toad是由厚本金融風控團隊內部孵化產生的標準評分卡庫。關於Toad的使用,之前已經寫過學習教程,Toa
餘額支付風控 風控評分模型篇 by dylanfan at 2015-2-11 一 概述 餘額支付的風險識別模型分爲兩類:(1)盜號交易識別風險 和 (2)盜卡交易識
五. 結果分析 結果分析我們包含兩部分,一是訓練過程的分析,二是模型效果的分析。 5.1 模型誤差評估 關於偏差和方差的問題不再敘述,偏差和方差是統計模型必有,除了增加數據以外,主要還是通過調整模型的超參來降低偏差和方差。 調參問題——網
書接上文。 四. 模型實驗 這裏我們補充一些數據分析的東西。 1. 數據分析及可視化相關 熟悉pandas的操作 matplotlib/ seaborn 可視化分析 (數據科學學習手札62)詳解seaborn中的kdeplot、rugpl
之前收款模式已經有,流程大概是 1:先添加好友,拉起好友聊天界面,自動輸入需要的金額跟單號 2:用戶發送消息,給收款賬戶 3:收款賬戶監聽到對應的消息,根據金額跟備註發送消息給客戶 4:客戶收到收款訂單或手動支付訂單 5:監聽到訂單後回調
工作中常用的特徵工程有哪些方法呢?首先,我們需要了解業務中的模型會遇到什麼問題,定位了問題才能找到貼合業務場景的特徵工程方法。這比你會一些處理特徵的騷操作重要很多,畢竟模型落地不是在打比賽,某個評價指標提高一點點就行,需要考
本文轉自https://github.com/xsj0609/data_science/tree/master/ScoreCard 一、評分卡邏輯 信貸業務評估的是客戶的客戶違約率(Percent of Default)即P
評分卡實現和評估 上一節講得是模型評估,主要有ROC曲線、KS曲線、學習曲線和混淆矩陣。今天學習如何實現評分卡和對評分卡進行評估。 首先,要了解評分卡是如何從概率映射到評分的,這個之前寫過評分卡映射的邏輯。見邏輯迴歸卡評
變量分箱是評分卡建模流程中的關鍵環節,可以說是評分卡的核心環節。合理的分箱可以消除變量的量綱影響,而且能減少異常值等噪聲數據的影響,有效避免模型過擬合。此外,分箱可以給模型實現業務上的可解釋性,可以說是評分卡的核心了。
一直想寫一篇文章梳理一下工作以來彎彎曲曲的成長路徑,以及自己在成長過程中一點一滴的感觸,希望對一些剛畢業或者迷茫中的人一點幫助和啓發吧。 本人18年7月份畢業,應用統計學,本科。第一份工作在南京某央企做數據分析師,主要業