IEEE聯邦學習標準有望兩年內推出,填補AI領域“黑洞”

4月11日,創新工場宣佈南京國際人工智能研究院執行院長馮霽當選IEEE聯邦學習標準制定委員會副主席,並預計IEEE聯邦學習標準將於兩年內推出。

針對聯邦學習這一概念,業界有兩種截然不同的看法,有人認爲其萌芽初期就被邊緣化,人也有人認爲它堪稱“深度學習2.0”。聯邦學習的作用是被誇大還是低估了?此外,創新工場人工智能工程院執行院長王詠剛還提出了一個有趣的觀點,認爲AI領域也存在一個“黑洞”,這究竟是何意?

馮霽當選IEEE聯邦學習標準制定委員會副主席

創新工場宣佈,創新工場南京國際人工智能研究院執行院長馮霽當選IEEE聯邦學習標準制定委員會副主席。

IEEE,全稱Institute of Electrical and Electronics Engineers,即國際電氣與電子工程師協會,是目前全球最大的非營利性專業技術學會。IEEE下設的標準協會是世界領先的標準制定機構,其標準制定內容涵蓋人工智能等前沿信息科技,以及通信、電力和能源等多個科技領域,對全球科技發展具有舉足輕重的影響。目前,IEEE標準協會已經制定了900多個現行工業標準,包括衆所周知的有線與無線網絡通信標準等。

創新工場馮霽團隊在此次IEEE聯邦學習標準制定過程中,承擔了數據安全、系統安全、算法安全相關的技術規範制定工作,屬於此次標準制定工作中的核心工作之一,做出突出貢獻,因此馮霽當選IEEE聯邦學習標準制定委員會副主席。

馮霽,目前擔任創新工場南京國際人工智能研究院執行院長,在魯棒性和安全性人工智能以及計算金融領域進行研究與落地工作,從整體上負責南京研究院的團隊建設、科研拓展、應用研發、學術交流與合作等工作內容。師從南京大學周志華教授,專注於新型深度學習算法和理論的研究。其參與的深度森林系列研究,在學術界和工業界獲得了較爲廣泛的關注和影響。現擔任IEEE聯邦學習標準制定委員會副主席,以及多個人工智能頂級會議包括NeurIPS-19、AAAI-18、ICML-19的程序委員,在數據驅動下的計算金融、金融時間序列分析、全棧式人工智能系統的搭建和技術人員的培訓上有着豐富的經驗。

標準制定過程

IEEE聯邦學習標準的制定過程是怎樣的呢?

馮霽表示,IEEE標準的制定過程,是在IEEE的指導下成立委員會,企業會員自主參與,共同擬定標準後投票通過,最後由IEEE官方正式發佈,作用和影響在於對此技術達成國際共識,未來各家機構在開發針對數據隱私保護的人工智能系統時,可以有一個綱領性的指導文件。一個技術滿足了某個具有公信力的國際標準,會更具有說服力。另外,這個標準也會幫助立法機構在涉及隱私保護的問題中提供技術參考。

目前各國隨着數據隱私保護法律的出臺,對此類技術的需求逐漸成爲國際共識,一項重要的技術,需要一個國際標準進行規範和約束,如聯邦學習技術可滿足GDPR的要求。

中國研究者重要貢獻

此外,馮霽表示國際標準需要多方共識共同決定,對中國企業提升話語權很有幫助,也有助於更多的國內企業儘早部署和研發具備隱私保護的人工智能系統。王詠剛也表示,聯邦學習作爲一個完整的技術框架,包含一整套基礎架構的標準設計,和每一個環節承擔不同功能的核心技術。

聯邦學習技術最早誕生和萌芽時期,中國研究者就對其中的很多核心技術,做出了很多至關重要的貢獻。比如,和數據安全分享時的加密技術相關的很重要的同態加密技術就有清華大學姚期智院士團隊,以及清華大學姚班幾位老師的重要貢獻。港科大、微衆銀行的楊強老師更是主動倡導將聯邦學習技術標準化,將國際、國內研究聯邦學習的科研力量、工程力量組織在一起,共同討論,共同制定標準。

數據隱私保護意義重大

未來,IEEE聯邦學習標準制定委員會將圍繞聯邦學習技術與相關的基礎AI技術積極開展工作,大力推動AI時代下的隱私保護、數據安全、應用安全等領域的體系規範化和技術標準化,意義深遠。

據馮霽透露,委員會初步預計將於6月15日在美國加州召開第二次委員會,屆時國際各家機構將會進一步探討標準的細節。

聯邦學習

這個標準中的聯邦學習是指什麼呢?

聯邦學習(Federated Learning)是一種新興的人工智能基礎技術,在 2016 年由谷歌最先提出,原本用於解決安卓手機終端用戶在本地更新模型的問題,其設計目標是在保障大數據交換時的信息安全、保護終端數據和個人數據隱私、保證合法合規的前提下,在多參與方或多計算結點之間開展高效率的機器學習。聯邦學習有望成爲下一代人工智能協同算法和協作網絡的基礎。

聯邦學習被邊緣化VS. “深度學習2.0”

聯邦學習這一概念提出的時間不長,但現在有人把它稱爲“深度學習2.0”。但另一方面,也有業內人士稱,聯邦學習在以前是特別邊緣的一種機器學習技術,質疑這個詞突然火起來炒作成分更大。聯邦學習被稱爲“深度學習2.0”是否被誇大?除了數據隱私保護,它還有哪些具體應用?

對此,馮霽否認了聯邦學習是邊緣技術這一說法,認爲這是一種比較新的前沿技術,主要解決分佈式框架下數據隱私保護的問題,換言之,如何在不分享數據的前提下,分享從數據中獲得的知識,從應用角度來看具有很重要的意義。另外,聯邦學習可使用的機器學習算法不侷限於神經網絡,還包括隨機森林等重要算法。

同時,王詠剛表示聯邦學習與“深度學習”不是一個層面的概念,深度學習是機器學習算法的一種,是人工智能訓練模型的方式之一。而聯邦學習是一種機器學習模塊之間的協同框架,從體系架構、交換標準、接口標準上,保證深度學習或其他機器學習技術可以在不同主體之間順利、安全完成。此外,王詠剛還明確表示個人不喜歡這種提法,因爲缺乏邏輯性。

AI領域的“黑洞”效應

此外,創新工場人工智能工程院執行院長王詠剛還提到了一個有趣的觀點,他表示自己在關注黑洞照片的發佈會直播,而人工智能領域其實也有一個“黑洞”效應——訓練數據越多、數據維度越豐富,就越容易得到好的人工智能模型;但數據往往分散在各個不同的擁有者那裏。出於數據安全以及保護個人隱私的原因,數據擁有者無法將原始數據提供給第三方使用。數據就越來越被吸引到一個又一個局部的“黑洞”裏,無法逃逸。

聯邦學習就像一個安全的、友好的,既能保證黑洞之間順利交換數據,又不破壞數據安全、個人隱私的“橋樑”,可以在兩個或多個參與“黑洞”之間,訓練出最好的模型,同時又不讓黑洞之間互相暴露原始數據。這屬於一種魚與熊掌兼得的技術,未來發展和未來價值都特別值得關注。
未來,創新工場基於人工智能工程院的研發平臺,也將進一步開拓人工智能前沿科技與真實商業場景的結合,通過廣泛的科研合作、商業合作、高端AI人才培養等紮實工作,迎接AI商業化時代的到來。

IEEE聯邦學習標準應運而生

近年來,伴隨人工智能技術的高速發展,數據安全和隱私保護問題成爲業內關注的焦點。大數據是AI時代的核心“能源”。如何在AI時代既保障用戶的個人數據隱私,又促進大數據協作和交換的順利發展?如何面對數據帶來的倫理道德挑戰?怎樣避免數據壟斷的出現、打破數據孤島的困境?……這些都是各大學術及行業會議上,中外專家學者不斷討論的重要議題。

一個簡單的例子是:今天我們每個人都在手機上使用輸入法,而輸入法爲了做到儘量精準,就要基於用戶個人的輸入習慣訓練人工智能模型。傳統方案難免要將用戶個人輸入的原始信息上傳到雲端進行統一訓練,這一做法過度收集了用戶隱私,使用戶隱私面臨被濫用的風險。而新興的聯邦學習技術可以在完成相同功能的情況下,做到只在用戶的手機端訪問用戶個人輸入信息,不上傳任何隱私數據。手機端和服務端在保證隱私安全的情況下協同訓練。

IEEE聯邦學習標準項目即將應運而生。目前,IEEE聯邦學習標準制定委員會正在制定這一標準,這是國際上首個針對人工智能協同技術框架訂立標準的項目,由國際著名人工智能學者楊強教授領銜擔任主席,對數字信任、科技向善的培育意義深遠,爲人工智能行業的進一步發展開闢新的道路。

應用場景

聽起來,這個標準的制定意義重大,但是具體到日常生活中的應用,它還會這麼“接地氣”嗎?

王詠剛和馮霽表示,IEEE聯邦學習標準將會在日常生活場景中發揮重要的作用,相信未來我們日常生活的方方面面都會有人工智能的影子。許多人工智能都需要利用不同數據源的聚合數據進行訓練——這種場景下,聯邦學習就像一個安全的道路網絡,可以既滿足人工智能的訓練要求,又保障我們的個人隱私不被濫用,因爲這個道路網絡上跑的是無法還原到原始數據的加密信息。

比如如何在不採集單個學員的學習軌跡數據下,訓練更智能的知識點推薦系統。

再如,學校有學生的學習過程的相關數據,課外的輔導機構有學生參加課外訓練的相關數據,暑假夏令營有學生在夏令營裏的學習過程的數據……這些數據其實都涉及到個人隱私,如果不進行加密或不在安全標準下進行聚合與交換,我們是無法在所有不同數據源上訓練最能反映這個學生學習歷程的人工智能模型的。但是在聯邦學習的幫助下,我們就有可能建立起一個安全的共享機制,完全不交換原始隱私數據,只在加密的數據上進行聚合訓練,就可以得出可以完整反映學生情況的AI模型,再利用這個模型爲學生定製他未來的學習計劃。

此外,未來用戶的上網偏好、購物信息等隱私信息在聯邦學習的支持下,可以只保存在自己的手機裏,完全不上傳到任何一個服務器或雲端。同時,那些需要根據大量用戶對某種商品的喜好來預測未來倉儲、定價的電子商城、超市等,可以只根據無法還原到隱私的加密信息,訓練出最好的預測模型,做到供應鏈管理的最優化,降低零售渠道成本,最終體現爲用戶可以用更便宜的價格買到更好的商品。

有望明年出臺,多巨頭已參與

但由於國際標準的制定需要進行很多細節的討論,馮霽透露,按照正常進度,IEEE聯邦學習標準將在兩年內推出。目前,IEEE聯邦學習標準項目需要解決的問題很多,包括技術的定義、分級、安全性等,每一次會議都需要投票通過,各方從各個角度對該技術的細節達成共識,因此耗時較長,預計兩年內纔會推出。

目前,已有30餘個互聯網巨頭公司、政府單位、企業和高校參與到標準制定工作中,國內參與方包含中國電信、騰訊、京東、小米、微衆銀行、順豐、平安一賬通、招商金科、深圳市標準技術研究院、香港科技大學、香港理工大學等。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章