DeepMind大突破!AI模擬大腦導航功能,學會像動物一樣“抄近路”| Nature論文 量子位 2018-05-10 嶽排槐 綜合自澎湃、wired英國等 量子位 出品 | 公衆號 QbitAI

今天凌晨,DeepMind又有新Nature論文發佈!

這次他們又訓練出了一個AI智能體,學會了類似哺乳動物一樣的“抄近路”能力,這次研究的目的,就是設法模仿人類大腦,用複雜的方式在周圍空間裏導航。這是一個前所未有的探索,被認爲是理解大腦的一次重大進步。

空間感知,對已經輕鬆成爲圍棋大師的AI來說,還是一件難事。

當你沿着熟悉的街道前進,繞過障礙,找到最快抵達目的地的捷徑時,大腦裏發生了什麼?這是一個非常複雜的事情。

科學家們在動物和人類大腦中找到了三種跟認路相關的細胞,分別是位置細胞、方向細胞和網格細胞。

位置細胞能在主體到達特定地點時放電,從而賦予對過往地點的記憶;方向細胞能感應前進的方向;網格細胞則是最神祕的一種:它們能將整個空間環境劃分成蜂窩狀的六邊形網格,彷彿地圖上的座標系。

發現網格細胞的的莫索爾夫婦因此獲得了2014年的諾貝爾生理學或醫學獎。不過,網格細胞僅僅是在空間環境中提供GPS定位服務嗎?

一些科學家猜測,它們也會參與矢量計算,輔助動物規劃路徑。

DeepMind團隊決定用人工神經網絡檢驗上述猜想。

人工神經網絡是一種利用多層處理模擬大腦神經網絡的運算結構。團隊首先用深度學習算法訓練神經網絡學習哺乳動物的覓食運動路徑,利用線速度、角速度等信號在視覺環境中進行定位。

研究人員隨後發現,一種類似於網格細胞活動特徵的結構自動誕生了!在此前的訓練中,研究人員並未刻意引導神經網絡產生此種結構。

DeepMind團隊隨後利用強化學習檢驗這種網格結構是否能夠進行矢量導航。強化學習被普遍用於訓練遊戲AI,人類告訴AI一種遊戲的得分獎懲機制,但卻不教授遊戲方法,由AI在反覆進行遊戲、努力爭取更高分的過程中自我進化。

研究人員將之前自動出現的網格結構與一個更大型的神經網絡架構結合成了人工智能體,置於虛擬現實的遊戲環境中。經歷強化學習後,該人工智能在遊戲迷宮中向目的地前進的導航能力超越了一般人,達到了職業遊戲玩家水平。它能像哺乳動物一樣尋找新路線和抄近路。

最關鍵的是,當研究人員“靜默”原來的網格結構後,人工智能體的導航能力就會變弱,判斷目標的距離和方向都更不準確了。

論文作者之一Dharshan Kumaran說道:“我們證明了網格細胞遠不只是給我們提供GPS定位信號,也是一種大腦賴以計算兩個地點間的最短距離的核心導航機制。”

哈薩比斯說,要證明我們能構建出來我們想做的那種通用智能,大腦的存在就是一個證據。所以從神經科學中爲新的算法尋找靈感,是很有道理的。但我們同時也相信這種啓發應該是雙向的,人工智能研究的見解也能爲神經科學中的開放問題提供靈感。

“這項工作就是一個很好的例子:通過構建一個能在複雜環境中導航的人工智能體,我們強調了生物網格細胞在哺乳動物導航中的重要性,也拓寬了這方面的理解。”哈薩比斯表示。

DeepMind團隊相信,類似的研究方法還可以用來探索大腦聽覺和控制四肢的機制。在更遠的將來,神經科學家們甚至可以用人工智能代替小白鼠來做實驗。

同時也用人工智能體驗證了哺乳動物大腦中的“網格細胞”對基於向量的導航有支持作用。

這還有兩篇研究人員的視頻訪談,更細緻的進行解讀。



論文

這篇論文題目爲:Vector-based navigation using grid-like representations in artificial agents 。

論文作者20多人,其中也包括哈薩比斯本人。

地址在此:https://www.nature.com/articles/s41586-018-0102-6

論文預覽傳送門: http://t.cn/R3283LN

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章