eBay的AI可以識別40%的“高精度”信用卡欺詐案例

信用卡欺詐比您想象的更常見。2014年,在1760萬起執法身份盜竊事件中,86%的受害者報告與現有信用卡或銀行賬戶有關的欺詐行爲。事實上,根據聯邦貿易委員會的統計,信用卡欺詐是美國 最常見的身份盜用形式,每年有超過130,000份報告。

檢測可疑卡使用模式的自動方法並不是什麼新鮮事,但eBay的研究人員在預印本服務器Arxiv上發表的一篇新論文(“ 電子商務中的信用卡欺詐檢測:異常檢測方法 ”)中描述了一種尖端技術。有機 他們提議的系統使用經過訓練的算法來識別“良好行爲”,因爲它涉及交易和支付,並標記超出預期規範的活動。

“通常,與欺詐和垃圾郵件檢測等任務相關的挑戰是缺乏訓練合適的監督學習模型所需的所有可能模式,”該論文的作者寫道。“當欺詐模式不僅稀缺時,這個問題更加突出,它們也隨着時間而變化......有限的數據和不斷變化的模式使得學習變得非常困難。我們假設良好行爲不隨時間變化,表示良好行爲的數據點在不同分組下具有一致的空間特徵。“

研究人員利用聚類方法的“整體” - 用於識別數據集中類似對象組的技術 - 具有不同的參數。在每個訓練運行中將每個數據點分配給一個集羣,從該集羣產生數學表示(矢量),構成數據點的“指紋”,該指紋可以組合成它的唯一簽名錶示。

爲了生成表示“良好行爲”(即一致性)的簽名,團隊將每個數據點向量組合在一起,並根據相應羣集的大小對其進行加權,得到0到1之間的單個分數。低一致性 - a得分接近0 - 自然對應於異常行爲。

他們寫道,這種方法比傳統的AI欺詐檢測有幾個優點。它不需要事先了解異常值或內點。並且基礎算法(1)具有高度可擴展性和(2)通用性; 它幾乎可以應用於任何羣集問題,包括醫學領域的問題。

該團隊採購了數據科學平臺Kaggle的公開信用卡數據庫 - 其中包含了2013年9月歐洲持卡人在兩天內(其中492個是欺詐性)進行的284,807份信用卡交易樣本 - 以測試他們的方法。在總共10次運行之後,該算法能夠以“高精度”識別40%的欺詐案例。

它並不完美 - 它標誌着29項合法交易 - 但正如他們在報紙中指出的那樣,考慮到成千上萬的數據點,這是“一個巨大的收益”。

“我們的[技術]非常有用,因爲在284,807個樣本中,我們可以安全地排除139,220個[交易],”他們寫道。

如果您最近在eBay上購買或出售過某些東西,您可能會遇到該系統的運行情況。研究人員靦腆地指出,它成功地從“電子商務平臺”中挑選了數據中的欺詐交易:

“[我們]方法的動機來自於試圖在電子商務平臺上識別欺詐性消費者......每當電子商務公司引入新的消費者輔助功能或對某些交易行爲施加限制時,它就爲一些消費者濫用和打開了新的大門和途徑。濫用平臺。我們的算法在識別[欺詐]方面顯示出巨大的潛力......但是,由於數據集的機密性,這些結果無法在本文中報告。“

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章