北大王立威教授：數據隱私的研究關鍵在於如何定義隱私

????點擊上方藍字星標“Robinly”，及時獲取更多重磅AI訪談

Robin.ly 是立足硅谷的視頻內容平臺，服務全球工程師和研究人員，通過與知名人工智能科學家、創業者、投資人和領導者的深度對話和現場交流活動，傳播行業動態和商業技能，打造人才全方位競爭力。

Robin.ly在NeurIPS 2019 現場特邀北京大學信息科學技術學院計算機科學與技術系的王立威教授，分享了他在 NeurIPS 2019 大會被接收的研究論文，同時他也對數據隱私、中美兩國在 AI 研究趨勢的差異作了深入分析。

王教授長期從事機器學習領域相關研究，爲解釋深度學習算法、boosting 算法、主動學習、隱私保護學習等算法的泛化性做出了重要貢獻。自2002年以來，在NeurILS、CVPR、ICML、TPAMI等國際頂級期刊和會議上發表了 100 多篇論文。他是第一位被IEEE評爲“人工智能十大新星”的亞洲研究人員，並參與編寫2009版《機器學習及其應用》及2015版《差分隱私保護的機器學習》的相關章節。

王立威（左）在NeurIPS 2019會場接受Robin.ly專訪

以下爲完整訪談實錄，點擊“閱讀原文”獲取英文實錄。

NeurIPS 2019 的論文亮點

Margaret Laffan: 王教授，您在 NeurIPS 2019 提交的三篇論文已經被大會接收。能介紹一下這些文章的主要貢獻嗎？

王立威：

這三篇論文中有兩篇是焦點論文（spotlight papers），也就是在所有接收論文中前 10％的優秀論文。但我想提到的是另外一篇牆報論文。在這篇論文中，我們提供了一種新算法，完全解決了在線學習（online learning）領域存在了 10 年的開放性問題，並獲得了非常有趣的結果，比前人的方法能夠更有效地解決許多實際應用問題。

差分隱私機器學習

Margaret Laffan: 作爲機器學習和模式識別方面的專家，您撰寫過一本有關機器學習和差分隱私的書。數據隱私是當前的熱門話題，您認爲這個領域目前的技術侷限在哪裏？我們應該如何解決？

王立威：

我從事數據隱私工作有 10 多年了。大約 15 年前，人們已經開始對數據隱私進行研究，但是在所有這些工作中都存在一個關鍵問題：對於“數據隱私”這個概念的定義五花八門，但是並沒有關於啓發式算法的定義（heuristic algorithms）。例如，有人發明了一種保護隱私的算法，後來又出現了一種可以攻擊這種隱私保護算法的新算法。發生這種情況就是因爲對隱私的定義不是很明確。

但是在 2006 年，誕生了一種對隱私的嚴格定義，即“差分隱私”的概念。如果我們設計了一種算法，並證明它可以保護差分隱私，那麼無論計算機具有什麼計算能力，具有什麼先驗知識，我們都可以保證它無法破壞數據的隱私。自那之後，數據隱私領域的大部分工作都建立在差分隱私上。所以可以說這是一項突破，是數據隱私領域一次巨大的進步。

當然，差分隱私也存在侷限性。這種侷限性在於，我們需要爲數據添加大量噪聲以保護隱私，而這種噪聲會損害數據本身的實用性。我認爲一種解決方法是尋找除了差分隱私，是否還存在其他更好的關於數據隱私的定義。所以一方面我們可以保護隱私，另一方面，對於要用於機器學習或其他統計目的的數據，也要保證其良好的實用性。

圖片來源：pixabay

中美在 AI 領域的差異

Margaret Laffan: 您在過去二十年的工作一直非常受人矚目，您也參加過很多全球性的會議。能不能談談中美兩國在研究方向，商業應用和產品商業化方面有何不同？

王立威：

在中國，如果我們擁有一項技術，就可以迅速將其應用於商業並開始盈利。我認爲這是中國比美國和加拿大，以及歐洲做得好的地方。但是對於 AI 的基礎理論的研究，我認爲西方國家的優勢更大。在中國，目前只有少數人從事 AI 相關的理論研究。如果中國想在 AI 領域真正佔據主導地位，還需要進行更深入的理論研究，並結合我們在應用，工程和技術上的優勢。

當然，中國也存在數據隱私問題，尤其是在醫療領域。中國有很多將 AI 應用於醫學分析的創業公司。不過針對這些隱私問題，中國政府也很快制定了相應的政策，鼓勵更多的公司在這一領域開展業務。我相信中國在這個領域的發展會非常迅速。

AI 領域下一個趨勢

Margaret Laffan: 在過去的十年中，您見證了中國的機器學習領域發生了哪些變化？放眼全球，您認爲 AI 領域的下一個主要趨勢是什麼？

王立威：

過去的十年，人工智能和機器學習在中國的發展非常迅速。許多學生和研究人員都在從事與 AI 相關的工作。AI 在工業界的發展尤其顯著，一項新技術甚至在幾個月內就能轉化爲產品。從學術角度來說，十年前在 NeurIPS 2009（那時候還叫 NIPS 2009），我清楚地記得來自中國的參會者只有 1％左右，來自中國的論文投稿一隻手也數得過來。但是現在我們已經能看到很多中國面孔，提交的論文也隨之出現了大幅度的增長。

從世界範圍內看，一個比較明顯的趨勢是將 AI，尤其是深度學習應用於行業的各個方面。目前，深度學習主要應用於計算機視覺，語音識別和自然語言處理，但在許多其他學科中，人工智能具有尚未被應用的潛力，例如通信。我已經與一些通信公司進行了交談，我認爲有機會使用 AI 技術來提高該領域的效率。

圖片來源：pixabay

NeurIPS 區域主席的責任

Margaret Laffan: 您也是 NeurIPS 的區域主席。能介紹一下這個角色的主要工作內容嗎？

王立威：

在過去的幾年中，NeurIPS 會議的論文提交數量呈現了指數增長，每年都會比上一年增加大約 50％。作爲區域主席，我們需要把控審閱流程的質量，仔細閱讀每一篇投稿，監督審稿人能否提出正確的建議並做出負責任的評論，以確保優質的論文能夠被接收。一個最重要的評判標準就是對所在領域的貢獻——是否提出了有針對性的新想法，當然如何用流暢的語言講一個好的故事也很重要。我認爲這是每位區域主席的責任。（完）

關注Robin.ly “Leaders In AI” Podcast

收聽更多英文訪談