數據挖掘技術在金融反洗錢中的應用

數據挖掘技術在金融反洗錢中的應用
--------------------------------------------------------------------------------
 
□ 李志強 李 靈 《商場現代化》 2007年第08期
1/2頁12 


  [摘要] 我國反洗錢金融監管面臨的突出問題反映在,現行反洗錢數據報告制度的海量數據、高誤報率、缺乏自適應性和易於被規避等問題。針對這些問題,本文提出需運用數據挖掘技術來構建金融機構中可疑交易行爲的識別方法。本文回顧了幾種常見的數據挖掘技術在反洗錢領域中的應用,並從兩個維度提出了基於金融賬戶的反洗錢可疑交易的識別方法的理論框架。
  [關鍵詞] 數據挖掘反洗錢
  反洗錢的情報收集和分析工作,就目前的實踐來看,尚未能夠起到顯著的指導作用。20 世紀90 年代數據挖掘技術的產生和發展, 爲可疑交易數據分析工作提供了嶄新的思路,極大地促進了反洗錢信息情報部門對報告數據的使用,數據挖掘技術必將在反洗錢實踐中發揮重要作用。
  
  一、洗錢的概念及我國反洗錢工作中的不足
  
  目前關於洗錢的定義有很多種,國際上並沒有一個統一的定義。《中華人民共和國反洗錢法》中第二條中關於的洗錢定義是:通過各種方式掩飾、隱瞞毒品犯罪、黑社會性質的組織犯罪、恐怖活動犯罪、走私犯罪、貪污賄賂犯罪、破壞金融管理秩序犯罪、金融詐騙犯罪等犯罪所得及其收益的來源和性質的洗錢活動,依照本法規定採取相關措施的行爲。
  我國反洗錢工作主要是通過可疑交易報告制度完成的,而金融機構的反洗錢的情報收集和分析工作中目前存在主要問題爲:(1)工作量大,誤報率高;(2)預設標準易於爲洗錢分子所規避;(3)無法自動適應洗錢形式的變化等。這就使得洗錢可疑交易行爲的識別存在巨大的困難。
  
  二、數據挖掘技術在反洗錢中的應用
  
  數據挖掘是指從大量數據中提取或“挖掘”有趣的知識。目前,發達國家的反洗錢系統都充分利用了數據挖掘工具。在反洗錢領域中,人工智能、聚類分析、歸納算法、神經網絡等都具有較強的適應性,具有廣闊的應用前景。
  1.人工智能在反洗錢調查中得到了快速發展。美國的FAIS系統綜合使用了人工智能技術和基於案例的推理、黑板(blackboard)等人工智能技術,其獨特的分析能力主要得益於其數據視角的轉變:從交易導向轉爲對象(如人或者組織)導向。每一筆交易、對象、賬戶都要用336條規則去測試,每條規則都給出是否爲非法或合法的判定證據,最後用貝葉思推理對每一個項目的可疑性進行評定。
  2.聚類分析是一種非監督的數據挖掘技術。在反洗錢領域,聚類分析技術特別適用於從大量的交易數據中產生及時、準確的線索。由於洗錢方式多種多樣,數據對象表現出來的分佈也就各式各樣,並不是所有的可疑賬戶都可以聚成一類。因此,在洗錢行爲識別中,簇的數量是未知的,因洗錢方式的不同而不同。聚類分析中“簇的數量未知”這個特點剛好滿足洗錢行爲識別的這個要求。而且,由於其聚類分析的自動處理、非監督學習等特性使得其可以動態地適應洗錢手段的變化,也可以在一定程度上規避洗錢犯罪活動的自適應問題。
  3.神經元網絡是一種從人工智能領域發展起來的,模仿人腦神經元結構,用神經網絡連接的權值表示知識,,過反覆學習訓練數據集,建立預測和分類模型的技術。神經網絡方法可以用於加強反洗錢的調查工作,節省跟蹤洗錢活動的時間。並能通過自動學習制定出最爲有利的反洗錢整體分析方案,提高數據分析效率。特別是調查人員可以學習相關的策略,這對於分析將來的案例是十分有益的。
  4.歸納算法,此方法可以用來產生決策樹,樹的每個分支都是一個分類問題。這種方法提供給反洗錢調查人員一系列彼此相互分離的獨特路徑,這些路徑爲分析者提供一個推理框架,幫助理解洗錢過程以及解決金融洗錢犯罪。反洗錢調查人員可據此總結出洗錢活動的共性和模式,然後通過對老的規則集進行改進建立起新的規則集,。並也可提供與反洗錢調查緊密相關的框架、結構。
  
  三、基於數據挖掘技術的金融賬戶洗錢調查方法
  
  金融機構在洗錢活動中處於極其重要的地位,常常被洗錢犯罪分子所利用。筆者認爲要想判別一個金融賬戶交易行爲是否正常,應從兩個維度上來判斷,一是縱向上,與自身過往歷史行爲模式比較;二是,橫向上,與其他賬戶之間做比較分析,從而發現此賬戶是否存在洗錢活動。
  在橫向上,本文認爲,橫向上應該採取聚類分析和孤立點探測相結合的方法。首先,通過採集一些與待識別客戶身份與業務特徵類似的正常客戶的樣本信息,建立參照組。然後,對樣本數據集進行聚類分析,分析結果中將出現聚類數據和離羣數據,刪除其中的聚類數據。經過上述數據準備處理後,對於剩下樣本,採用局部孤立點算法,對每個樣本計算其孤立值。最後,根據孤立值的大小對這些樣本進行排序。根據孤立值排序的結果也就是每個賬戶在相關屬性上的可疑程度順序表,監管中心可以根據自身資源情況和這個順序表決定深入調查的賬戶對象。
  在縱向上,判斷賬戶的即時交易行爲是否符合其一慣的交易模式,如果該即時交易行爲符合其一貫的交易模式,則被認爲是正常的,否則,則被認識是可疑的。在縱向上,本文提出斷點分析技術構建反洗錢調查方法。其主要思想是:建立一個移動的窗口,窗口中裝有一定數量的交易時序數據。基於交易連續統一體理論,利用斷點分析,判別新進入窗口的若干數據與窗口內的“舊”數據相比較是否表現異常。這樣通過斷點分析確定的異常點或點的集合對應的就是值得懷疑的交易,這些異常的交易行爲便是我們所要挖掘的可疑洗錢行爲。
  
  四、結束語
  
  利用數據挖掘技術進行反洗錢數據監測和分析,無論國內和國際的相關研究都是新穎的。本文在對常用的數據挖掘技術在反洗錢領域應用的述評基礎上,針對金融賬戶反洗錢問題從兩個維度上提出了兩種基於數據挖掘技術的反洗錢調查方法。下一步的工作將主要圍繞基於我國現行銀行業務條件下的特徵提取、算法的實際應用效果反饋分析等方面展開。
  參考文獻:
  [1]楊勝剛王鵬:基於數據挖掘技術的人民幣反洗錢系統設計.財經理論與實踐,2005,11:105-110
  [2]常樹民:金融業反洗錢問題研究.江西財經大學碩士學位論文,2004
 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章