螞蟻金服多次亮相2019國際頂會,聚焦AI前沿技術與應用實踐

2019年,是人工智能與機器學習技術快速發展的一年。對於螞蟻金服而言,過去一年的人工智能技術、產品、解決方案及研究成果已經在 NeurIPS、KDD、ICML、SIGMOD、SIGIR 等各大國際頂會上陸續亮相,爲學界帶來了諸多來自實際業務場景的創新研究和應用分享。

正如《哈佛商業評論》2020一月刊裏文章提到:螞蟻金服所服務的客戶數量是美國最大銀行的10倍多,員工數量卻不到其十分之一。不同於傳統金融機構,螞蟻金服所提供的消費信貸、貨幣基金、財富管理、醫療保險、信用評級,甚至是螞蟻森林等各種各樣的服務,其關鍵路徑均是“無人工”的模式,從而使得業務能夠實現快速增長與突破,而這主要得益於背後的人工智能技術與海量的支付寶數據,“AI runs the show”。

緊抓核心技術能力 持續沉澱基礎研究應用成果

在人工智能領域,過去一年螞蟻金服相繼在 NeurIPS、ICML、ICLR、AAAI、IJCAI、SIGIR、NAACL、VLDB、ACM T-IST、KDD、CVPR 等全球頂級學術會議和期刊發表多篇論文成果,涵蓋計算機視覺、NLP、機器學習等領域,並在大型分佈式機器學習、強化學習、圖機器學習、無監督學習、數據挖掘等方向均取得突破,這些技術在解決金融場景複雜動態網絡、對抗性、魯棒性、安全性、外部性風險與信息不完備性、實時性等問題上均發揮了重要作用。

比如在2019年6月的 ICML 會議(International Conference on Machine Learning,即國際機器學習大會)上,支付寶AI技術團隊即貢獻了多篇前沿論文研究成果。包括提出了用生成對抗用戶模型來解決強化學習小樣本的問題,並將此方法用於優化推薦系統;提出粒子流貝葉斯定理(particle flow Bayes'Rule)算法,實現對高維貝葉斯推理的精確度和計算效率的提升優化等等。

032f2b3b-2776-43a8-8ab8-2120230bdf90.png

在支付寶業務資金鍊路和運力優化等場景會涉及組合優化和整數規劃問題,車輛路徑規劃作爲該類問題的經典場景,支付寶AI團隊提出一套新的 CVRP 算法進行求解(ICLR2020),能夠有效發揮機器學習和傳統運籌優化各自長處,對比 Google OR-tools提升了10%,並優於 FAIR,Google 以及各種AI頂會的結果。

爲了提升AI模型在金融業務場景的安全性和魯棒性,支付寶AI團隊通過深度對抗學習等相關技術打造了體系化的解決方案。例如藉助於動態網絡中可解釋的分層信道選擇,顯式地將網絡決策路徑可視化,並提出了一種對抗性實例檢測算法(AAAI 2019),該方法能夠獲得更高的預測精度,並顯著提高多個***的檢測率。而面對支付金融場景對模型魯棒性的要求,首創了三種可顯著降低一些圖神經網絡模型效果的***手段(ICML 2018):基於層次強化學習的***、基於遺傳算法的***和基於梯度的***。並提出針對性的對抗訓練方法,從而提升模型的魯棒性和安全性。

同時,爲了更高效提取特徵,支付寶AI團隊開發了 SAFE: Scalable Automatic Feature Engineering Framework for Industrial Tasks (ICDE 2020),從而滿足金融場景下對高適用性、分佈式計算與實時推理的強需求。

由於金融市場天然具備的外部性風險與信息不完備性,螞蟻金服在博弈論與多智能體等前沿技術上也在持續投入研究與應用探索。包括提出了 Double Neural Counterfactual Regret Minimization 計算框架(ICLR 2020,以第一單位論文發表),使得CFR可求解超大規模非完全信息博弈IIG問題,同時提出了 mini-batch robust sampling 算法,使得 Monte Carlo CFR 算法收斂速度大幅提升,在雙人非限制性德州撲克遊戲中,該算法可以收斂到與傳統 CFR 算法相似的結果,而存儲空間卻不到其200分之一;另外還提出了一種比 Discounted CFR 更快收斂的CFR算法,在非限制性德州撲克中,該算法比 DeepStack 中的 Hybrid CFR 算法收斂速度快兩倍。

金融市場通常面臨複雜動態網絡裏的多智能體問題,螞蟻金服創新性提出 value propagation 算法用以解決多智能體問題。具體而言,該算法去中心化訓練和去中心化執行場景中 multi-agent reinforcement learning 的值函數傳播問題。該方法可用於解決目前多智能體問題面臨的諸多挑戰:比如多個 agent 如何在只觀測到自己獎勵函數的情況下學會合作,以及 multi-agent reinforcement learning 算法的收斂性等。在資金優化和交通控制等業務場景中該算法有着廣闊的應用場景。

深度學習面臨的一大挑戰是如何在理解的基礎上做推理。在 NLP 裏的推理問題上,近日螞蟻金服的一項工作超越其他科技公司登頂數字離散推理 DROP 榜單。DROP 與傳統 MRC 數據集的主要區別在於需要根據問題和上下文做數字邏輯推理才能得出正確答案。主要方法是通過構建數字、日期等常識符號圖譜,並基於 GCN 建圖,使用 Hard-EM 算法對推理表達式的隱變量進行迭代學習。此外,如何處理海量信息、提升服務效率也已成爲國際頂會重點關注話題,在展示信息檢索領域 SIGIR 2019 頂會上,支付寶AI團隊提出利用強化學習預測用戶意圖,實現“未問先答”的功能。

這些智能服務背後,少不了螞蟻金服自主研發的金融級分佈式關係數據庫 OceanBase 的支撐。在2019年最新發布的 TPC-C 測試排行榜中,OceanBase 超越 Oracle 榮登榜首。目前,除了支持螞蟻金服自有業務、阿里巴巴集團雙十一的流量考驗以外,還支持着數十家金融機構的業務。

可以說,國際頂會上諸多基礎研究與應用創新成果分享,讓螞蟻金服成爲全球學界和工業界不可忽視的力量。而基於螞蟻金服十五年演進並全面對外開放的“BASIC”技術體系,更多基礎研究應用成果因爲也將逐漸在產業應用中落地。

提高AI落地服務水平 以技術創新推動普惠金融

實際上,頂級學術會議交流的火熱,一方面可推進基礎技術最前沿研究的發展,將學術研究與應用相結合,另一方面可推進前沿技術在實際應用中落地,爲用戶帶來價值。正如此前螞蟻金服副總裁及首席AI科學家漆遠所表示的,“發展和使用人工智能技術,我們能夠爲螞蟻金服全球超過12億的用戶解決真正的問題,提供真正有意義的服務。”

比如早在2005年,支付寶便率先推出“你敢付,我敢賠”,承諾如果賬戶被盜全額賠付。2019年,支付寶又將其升級爲“秒賠”+“先賠”:用戶的投訴如果經AI確定,賠付能秒到賬;如果案件存疑,也會先賠再說。在此背後,正是支付寶安全團隊在 KDD CUP 2019 大賽上獲得全球第一的AI應用能力。

b8abe627-b0de-4f81-b203-7488b5948f84.png

基於豐富的人工智能技術應用場景,目前螞蟻金服已經沉澱了業界領先的分佈式機器學習平臺支持大規模深度圖算法、在線學習、共享學習、強化學習等能力,以及金融視覺、金融知識圖譜、機器人平臺、NLP平臺等通用能力。

以大規模深度圖算法的應用實踐爲例,面對金融場景可解釋性的要求,螞蟻金服在 AAAI 2019 的多篇論文中介紹瞭如何在圖機器學習過程中引入了 attention 機制來學習不同廣度/深度鄰居的重要性,以及異質信息的重要性。這些算法不僅爲不同類型圖數據提供更強大的表達學習能力,同時也提供不同層次的可解釋性,目前已應用於智能營銷、信用風險、安全風控等多個支付金融場景,極大降低了產品運營成本和欺詐資損從而提高業務收入。

而在2019年關於機器學習和計算神經科學的國際會議——NeurIPS(全稱神經信息處理系統大會)上,螞蟻金服也有多篇論文入選,聚焦 GAN、GNN、深度強化學習等課題。在 NeurIPS 2019 展臺現場還展出了基於圖像識別、環保知識圖譜等技術的智能垃圾分類小程序和智能回收箱視頻,觀衆可通過手機拍照輕鬆識別垃圾物品和對應的垃圾類別,現場體驗來自東方的“生活小助手”。目前,這套圖像識別技術已逐步開放給行業夥伴。利用支付寶的海量用戶覆蓋能力和城市服務的便民心智,結合 AI+IoT 技術,實現人工智能識別垃圾和分類,用科技推動個人與企業單位參與垃圾分類回收的積極性和處理效能。

c8f0aca5-bb15-4413-82a8-75a8edf6cd77.png

此外,螞蟻金服在聲紋技術方面部分工作發表在國際語音頂會 IEEE ASRU 2019。在獲得同行評審專家的高度認可的同時,該創新技術已經在支付寶 APP 無線端聲紋業務落地,有效提高了安全性和用戶體驗。

隨着研究發展、頂會的大熱,AI、區塊鏈、計算系統等原本看起來“只可遠觀”的技術已不斷獲得突破,實實在在地爲我們的生活服務帶來改變。2019年已經翻篇,螞蟻金服AI研究的步伐也逐漸加快,AI技術落地服務水平迅速提高,通過技術創新和科技開放更好地推動普惠金融發展,帶來更加美好的智能生活。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章