Facebook開源CraftAssist,用於輔助Minecraft AI助理研究

Facebook AI研究人員開源了CraftAssist,一個爲Minecraft遊戲構建交互式助手機器人的框架。這些機器人使用自然語言理解(NLU)來解析和執行來自人類玩家的文本命令,比如在遊戲世界中建造房屋。研究人員可以擴展該框架的模塊化結構,執行他們自己的ML實驗。

研究小組在最近的一篇博客文章中概述了這個系統。CraftAssist機器人使用與標準遊戲客戶端相同的協議連接到遊戲中,所以它們可以做任何人類玩家可以做的事情。這些機器人使用Minecraft內置的基於文本的聊天接口與其他玩家互動。人類可以給機器人下達命令,包括高級指令,如“在藍色立方體旁邊建一座房子”。該版本的目標是幫助改善人機協作:

該平臺的目的是爲代理研究提供支持,人類可以與這些代理髮生有趣的交互,並且對由人類參與者指定和評估的各種任務來說很有用。爲了鼓勵更廣泛的AI研究社區使用CraftAssist平臺,我們開源了這個框架,以及一個基準助手,以及我們用來構建這個框架的工具和數據。

機器人控制系統一般由感知子系統和動作選擇子系統組成。感知是指將原始傳感器數據轉換爲更爲抽象的表示形式。例如,圖像識別是一種將圖像像素轉換爲描述圖像內容的文本標籤的感知任務。當使用與期望輸出配對的傳感器輸入數據集訓練現代深度學習模型時,它們可以在很多視覺和NLU任務上實現接近人類的水平。

行動選擇是指機器人“決定”如何與世界發生互動來實現某種目標的過程;例如,爲了贏得一場圍棋比賽而採取的行動。很多成功的系統都使用了強化學習(RL),即機器人反覆嘗試一個任務,每次嘗試都給出一個數字獎勵結果。遊戲是RL的一個常見測試平臺,因爲它們具有定義良好的操作和結果集,而經過現代RL訓練的機器人在很多不同的遊戲中常常能夠超越人類。一些研究小組(例如谷歌DeepMind)將感知和行爲選擇子系統結合成一個單一的經過深度RL訓練的“端到端”系統。現在有很多用於訓練這些系統的虛擬環境,包括Facebook開發的一個模擬棲息地。微軟已經爲Minecraft開源了一個叫作Project Malmo的“AI-gym”接口,以及一個大數據集,鼓勵人們使用Minecraft作爲RL研究的測試平臺。

CraftAssist並沒有使用端到端學習。相反,Facebook選擇了一種更“工程化”、模塊化的方式,建立了明確的感知和行動選擇模塊。正如一位團隊成員在Reddit上的一個帖子中所說的那樣,與RL項目(如“Project Malmo”)不同,“Project Malmo更注重學習之類的東西(如導航和感覺運動控制)”,CraftAssist更注重通過自然語言促進人類和機器人的互動。此外,研究小組在arXiv的一篇論文中說:

我們感興趣的不是在單個複雜任務上的表現,而是處理大量簡單任務的能力,而這些任務是由人類指定的(可能不太好)。

CraftAssist確實包含了一些機器訓練過的組件。機器人使用基於GRU和注意力模型的神經語義分析器來解析對話。機器人還有一個感知模塊,利用深度學習來給建築物的不同部分貼上標籤,比如“牆”或“地板”。研究小組希望這種模塊化結構可以鼓勵其他人“嵌入”他們自己用ML構建的模塊。

除了CraftAssist源代碼,Facebook還發布了幾個相關的數據集,包括用於訓練解析器的對話數據,以及由玩家在遊戲中構建的不同房屋的衆包數據集,這些數據集可用於訓練機器人構建類似的結構。代碼和數據集可以在GitHub上找到。

原文鏈接

Facebook Open-Sources CraftAssist Framework for AI Assistants in Minecraft

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章