DeepMind大突破！AI模擬大腦導航功能，學會像動物一樣“抄近路”| Nature論文量子位 2018-05-10 嶽排槐綜合自澎湃、wired英國等量子位出品 | 公衆號 QbitAI

今天凌晨，DeepMind又有新Nature論文發佈！

這次他們又訓練出了一個AI智能體，學會了類似哺乳動物一樣的“抄近路”能力，這次研究的目的，就是設法模仿人類大腦，用複雜的方式在周圍空間裏導航。這是一個前所未有的探索，被認爲是理解大腦的一次重大進步。

空間感知，對已經輕鬆成爲圍棋大師的AI來說，還是一件難事。

當你沿着熟悉的街道前進，繞過障礙，找到最快抵達目的地的捷徑時，大腦裏發生了什麼？這是一個非常複雜的事情。

科學家們在動物和人類大腦中找到了三種跟認路相關的細胞，分別是位置細胞、方向細胞和網格細胞。

位置細胞能在主體到達特定地點時放電，從而賦予對過往地點的記憶；方向細胞能感應前進的方向；網格細胞則是最神祕的一種：它們能將整個空間環境劃分成蜂窩狀的六邊形網格，彷彿地圖上的座標系。

發現網格細胞的的莫索爾夫婦因此獲得了2014年的諾貝爾生理學或醫學獎。不過，網格細胞僅僅是在空間環境中提供GPS定位服務嗎？

一些科學家猜測，它們也會參與矢量計算，輔助動物規劃路徑。

DeepMind團隊決定用人工神經網絡檢驗上述猜想。

人工神經網絡是一種利用多層處理模擬大腦神經網絡的運算結構。團隊首先用深度學習算法訓練神經網絡學習哺乳動物的覓食運動路徑，利用線速度、角速度等信號在視覺環境中進行定位。

研究人員隨後發現，一種類似於網格細胞活動特徵的結構自動誕生了！在此前的訓練中，研究人員並未刻意引導神經網絡產生此種結構。

DeepMind團隊隨後利用強化學習檢驗這種網格結構是否能夠進行矢量導航。強化學習被普遍用於訓練遊戲AI，人類告訴AI一種遊戲的得分獎懲機制，但卻不教授遊戲方法，由AI在反覆進行遊戲、努力爭取更高分的過程中自我進化。

研究人員將之前自動出現的網格結構與一個更大型的神經網絡架構結合成了人工智能體，置於虛擬現實的遊戲環境中。經歷強化學習後，該人工智能在遊戲迷宮中向目的地前進的導航能力超越了一般人，達到了職業遊戲玩家水平。它能像哺乳動物一樣尋找新路線和抄近路。

最關鍵的是，當研究人員“靜默”原來的網格結構後，人工智能體的導航能力就會變弱，判斷目標的距離和方向都更不準確了。

論文作者之一Dharshan Kumaran說道：“我們證明了網格細胞遠不只是給我們提供GPS定位信號，也是一種大腦賴以計算兩個地點間的最短距離的核心導航機制。”

哈薩比斯說，要證明我們能構建出來我們想做的那種通用智能，大腦的存在就是一個證據。所以從神經科學中爲新的算法尋找靈感，是很有道理的。但我們同時也相信這種啓發應該是雙向的，人工智能研究的見解也能爲神經科學中的開放問題提供靈感。

“這項工作就是一個很好的例子：通過構建一個能在複雜環境中導航的人工智能體，我們強調了生物網格細胞在哺乳動物導航中的重要性，也拓寬了這方面的理解。”哈薩比斯表示。

DeepMind團隊相信，類似的研究方法還可以用來探索大腦聽覺和控制四肢的機制。在更遠的將來，神經科學家們甚至可以用人工智能代替小白鼠來做實驗。

同時也用人工智能體驗證了哺乳動物大腦中的“網格細胞”對基於向量的導航有支持作用。

這還有兩篇研究人員的視頻訪談，更細緻的進行解讀。

論文

這篇論文題目爲：Vector-based navigation using grid-like representations in artificial agents 。

論文作者20多人，其中也包括哈薩比斯本人。

地址在此：https://www.nature.com/articles/s41586-018-0102-6

論文預覽傳送門： http://t.cn/R3283LN

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

DeepMind大突破！AI模擬大腦導航功能，學會像動物一樣“抄近路”| Nature論文量子位 2018-05-10 嶽排槐綜合自澎湃、wired英國等量子位出品 | 公衆號 QbitAI

論文

985 碩士程序員，空窗 4 個月沒有 Offer！

營銷系統黑名單優化：位圖的應用解析

我真的從測試轉成了開發......

nginx添加相應配置，通過瀏覽器訪問或curl時返回客戶端對應公網IP

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

python內置函數——sorted

[oeasy]python020在遊戲中體驗數值自由_勇闖地下城_終端文字遊戲

爲何我建議你學會抄代碼

一文搞懂 Spring 循環依賴

抖音面試：說說延遲任務的調度算法？

Google人工智能面試·真·題（附參考答案+攻略）

eCognition中導入矢量裁剪影像

DeepMind大突破！AI模擬大腦導航功能，學會像動物一樣“抄近路”| Nature論文量子位 2018-05-10 嶽排槐綜合自澎湃、wired英國等量子位出品 | 公衆號 QbitAI

深度學習 14. 深度學習調參，CNN參數調參，各個參數理解和說明以及調整的要領。underfitting和overfitting的理解，過擬合的解釋。

土地利用轉移矩陣的幾種實現方法

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

DeepMind大突破！AI模擬大腦導航功能，學會像動物一樣“抄近路”| Nature論文 量子位 2018-05-10 嶽排槐 綜合自澎湃、wired英國等 量子位 出品 | 公衆號 QbitAI

論文

DeepMind大突破！AI模擬大腦導航功能，學會像動物一樣“抄近路”| Nature論文量子位 2018-05-10 嶽排槐綜合自澎湃、wired英國等量子位出品 | 公衆號 QbitAI