人工智能十年回顧:CNN、AlphaGo、GAN……它們曾這樣改變世界

來源:機器學習研究組訂閱號

過去十年間,人工智能技術突飛猛進,最瘋狂的科幻小說場景現在已經成爲我們生活中不可或缺的一部分。十年前,人們在談論 AI 的理論化和實驗,但這些年來,AI 變得更加切實了,也變成了主流。無論是國際標準課程、平臺、庫、框架、硬件,一切都順理成章。就算說這十年裏取得的成績奠定了未來的基礎,也不爲過。

這篇文章將盤點 AI 十年來取得的重要突破。

卷積

2012 年是深度學習歷史上重要的一年。那一年,卷積神經網絡(CNN)在著名的 ImageNet 挑戰賽中大放異彩。由 Alex Krizhevsky 等人設計的卷積神經網絡「Alexnet」以遠超第二名的成績奪冠,在 ImageNet 數據集上的視覺識別錯誤率爲 15.3%,降低了一半。該神經網絡對貓的檢測準確度達到了 74.8%,在 YouTube 視頻中檢測人臉的準確率爲 81.7%。

現在,手機和商場中的人臉識別應用都應該歸功於 2012 年的這項工作,識別準確率的提升使研究者能夠進行醫學成像模型的部署,這些模型具備高置信度。

與 AI 對話

Vaswani 等人 2017 年發表的《Attention Is All You Need》帶來了級聯效應,使得機器能夠以前所未有的方式去理解語言。得益於 Transformer 架構,AI 現在能夠撰寫假的新聞、推文,甚至可能引起政治動盪。繼 Transformer 之後,谷歌又推出了 BERT 模型,將其用於關鍵字預測和 SEO 排名等。BERT 如今已經變成了自然語言處理領域的實際標準,諸如 Microsoft 和 NVIDIA 之類的公司開始堆積更多參數來追趕該模型。

NVIDIA 的 Megatron 具有 80 億個參數,而 Microsoft 的 Turing NLG 模型具有 170 億個參數。OpenAI 的 GPT 模型後來居上,1750 億參數的 GPT-3 目前是歷史記錄的保持者。

GPT-3 也是 Transformer 的擴展,是目前最大的模型,它可以編碼、寫散文、生成商業創意,只有人類想不到,沒有它做不到。

將人類一軍

AI 早已在國際象棋中擊敗了人類。而更加複雜的人類遊戲,如 Jeopardy! 遊戲、圍棋、德州撲克等,也沒有擋住算法的腳步。人工智能近幾年來最廣爲人知的事件就是 AlphaGo 在最複雜棋類遊戲——「圍棋」上擊敗了人類頂級選手。與此同時,在這個十年中,IBM 的 Watson 也在 Jeopardy! 決賽中擊敗了兩位人類,最終 Watson 獲得了 77147 美元獎金,而兩位人類分別獲得了 24000 和 21600 美元。

Facebook 和卡耐基梅隆大學共同開發的德撲 AI Pluribus 戰勝了五名專家級人類玩家,實現了前輩 Libratus(冷撲大師)未能完成的任務,該研究還登上了 2019 年的《科學》雜誌。2020 年 12 月,DeepMind 提出的 MuZero 讓一種人工智能模型掌握多種遊戲,包括將棋、國際象棋和圍棋。

解碼生命

每一個生物體的行爲都可以在其蛋白質中尋蹤溯源。蛋白質承載着祕密,破解蛋白質或許有助於擊敗新冠大流行。但蛋白質結構非常複雜,需要不斷地運行模擬。DeepMind 嘗試解決這一難題,其開發的深度學習算法「Alphafold」破解了出現五十年之久的蛋白質分子摺疊問題。計算機視覺被證明可以幫助診斷,而解決蛋白質摺疊問題甚至能夠幫助研發人員開發新藥。

AI:是藝術家,也是騙子

 

去年,在一則視頻中,比利時首相談論着解決經濟和氣候危機的緊急需求,後來人們發現這其實是 Deepfake 視頻。在機器學習和 AI 對比利時首相聲音和表達方式的操縱下,這則假視頻讓首相發表了一場關於全球變暖影響的演講。

這些僞造內容的背後是精心設計的算法——生成對抗網絡(GAN)。該算法在 2014 年提出,並得到廣泛應用,甚至已經侵入了人類工作的最後一道壁壘:創作。這種網絡可以生成從未存在的人臉、互換人臉,讓一國總統胡言亂語。GAN 生成的一幅畫甚至在佳士得拍賣會上以破紀錄的價格——40 萬美元成交了。GAN 的另一面是被用於惡意目的,以致於像 Adobe 這種公司不得不研究新技術來鑑別僞造內容。GAN 在下一個十年裏仍將是被廣泛討論的對象。

祕密武器——硅

神經網絡的概念誕生了半個世紀,今天流行的反向傳播方法也出現三十年了。但是,我們仍然缺少能夠運行這些計算的硬件。過去十年,我們見證了十多家公司研究專門的機器學習芯片。這些年來,芯片技術得到了極大發展,我們可以在手掌大小的設備上執行百萬次運算。這些芯片被用到數據中心,用戶可以觀看自己喜歡的 Netflix 電影、使用智能手機等。接下來,專爲邊緣設備定製的 AI 芯片蘊含着價值數十億美元的商機。

蘋果等公司已經開發了定製化機器學習芯片(如 A14 Bionic)來提供智能服務。即使是依賴英偉達和英特爾的 AWS,也正在慢慢進入芯片行業。隨着芯片變得越來越小,這一趨勢只會更加明顯:例如使用英偉達 Jetson AGX Xavier 開發者套件,你可以輕鬆創建和部署端到端 AI 機器人應用,用於製造、零售、智能城市等等。谷歌的 Coral 工具包可將機器學習帶到邊緣設備上。安全、實時輸出是目前的主題。

開源文化逐漸成熟

圖源:MIT Tech Review

2015 年,TensorFlow 開源。一年後,Facebook AI 又開源了基於 Python 的深度學習框架 PyTorch。今天,TensorFlow 和 PyTorch 已經成爲使用最廣泛的框架。通過不斷的版本更新,谷歌和 Facebook 爲機器學習社區帶來了極大便利。自定義庫、軟件包、框架和工具的爆發式增長,使得更多人進入了 AI 領域,也爲 AI 研究帶來了更多人才。

開源是近幾年的一個主要特性。開源工具和越來越多的可用資源(如 arxiv 或 Coursera)促進了 AI 變革。另一個催化劑是流行的競賽平臺——Kaggle。Kaggle 和 GitHub 滋養了一批高質量 AI 開發者。

更多學習,更少規則

Schmidhuber 教授上世紀 90 年代初提出的元學習概念,最近才逐漸得到關注。元學習指在有限訓練示例的基礎上,使機器學習模型學習新技能並適應不斷變化的環境。通過操縱超參數對特定任務優化機器學習模型需要大量用戶輸入的話,過程會較爲繁瑣,而使用元學習後,這一負擔將得到極大緩解,因爲元學習將優化部分自動化了。自動優化帶來了一個新的行業 MLaaS(機器學習即服務)。

未來方向

關於一些專家預測以下領域或許將發揮主要作用:

  • 可復現性

  • 差分隱私

  • 幾何深度學習

  • 神經形態計算

  • 強化學習

儘管 AI 已經進入許多我們未曾想象的領域,但它仍需應用到更流行的應用中,如自動駕駛汽車。然而,挑戰更多地在於數學層面:目前已有能夠做出準確決策的算法,也有能夠處理這些算法的處理器,但何時能夠部署到應用上仍未可知。不管是醫療還是自動駕駛汽車,AI 仍需要繼續進展,而這隻有在透明性和可復現性得到建立時纔會發生。

原文鏈接:https://analyticsindiamag.com/ai-top-decade-2010-2020-breakthroughs/

未來智能實驗室的主要工作包括:建立AI智能系統智商評測體系,開展世界人工智能智商評測;開展互聯網(城市)雲腦研究計劃,構建互聯網(城市)雲腦技術和企業圖譜,爲提升企業,行業與城市的智能水平服務。

  如果您對實驗室的研究感興趣,歡迎加入未來智能實驗室線上平臺。掃描以下二維碼或點擊本文左下角“閱讀原文”

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章