近日,哈佛大學和麻省理工學院沃森 AI 實驗室的研究人員發佈了 Clevrer 數據集,用於評估 AI 模型識別因果關係和進行推理的視頻診斷數據集。麻省理工學院 IBM 沃森實驗室負責人大衛·考克斯 (David Cox) 稱, Clevrer 數據集可以在創造混合 AI 方面取得進展,混合 AI 是指結合了神經網絡和符號 AI 的混合型 AI。IBM 研究團隊負責人達里奧·吉爾 (Dario Gil) 亦將神經符號 AI 列爲 2020 年最重要的進展之一。
Clevrer是一個診斷視頻數據集,用於系統評估各種推理任務上的計算模型。近期,在全數字化的國際表徵學習會議 (ICLR) 上發表的一篇論文中,介紹了有關視頻表徵與推理 (Clevrer) 數據集碰撞事件的初步研究成果。
Clevrer 建立在 Clevr 基礎之上。Clevr 是斯坦福大學 (Stanford University) 和 Facebook AI研究團團隊 (Facebook AI Research)於 2016 年發佈的一組數據集,用來分析神經網絡的視覺推理能力。該團隊成員包括大名鼎鼎的 ImageNet 創始人李飛飛 (Fei Fei Li) 博士。在國際表徵學習會議 (ICLR) 上,Clevrer 的共同創作者例如來自麻省理工學院-IBM 沃森實驗室 (MIT-IBM Watson Lab) 的莊根和來自 Deepmind 的普希梅特·科利 (Pushmeet Kohli) 等人對神經符號概念NS-DR (Neuro Symbolic Concept Learner,NS-DR),一種應用於 Clevr 的神經符號學模型做了介紹。
該論文寫道:“我們對視頻的時間和因果推理進行了系統性的研究。視頻的時間和因果推理這個問題非常深刻且具有挑戰性,它困擾研究人員很久了,但我們纔剛剛開始用‘現代化的’ AI 工具來對它進行研究。”“我們新開發的 Clevrer 數據集和 NS-DR 模型即是朝這個研究方向進行的初步探索。”
Clevrer 數據集由 Bullet 物理模擬器製作,包括 2 萬部展示桌面上物體碰撞的合成視頻和一組自然語言數據集,其中包括與視頻內物體相關的問題和答案。總共有超過 30 萬個這樣的問題和答案,它們被分爲描述性、解釋性、預測性和反事實性等類別。
麻省理工學院-IBM 沃森實驗室負責人大衛·考克斯 (David Cox) 在一次採訪中向 媒體透露,他堅信 Clevrer 數據集將有助於創造混合 AI,混合 AI 結合了神經網絡和符號AI。考克斯表示,IBM 研究團隊 (IBM Research) 將把該方法應用於 IT 基礎設施管理和工廠、建築工地等工業環境。
考克斯稱:“我認爲這個數據集對幾乎所有類型的應用都很重要。“通過該數據集,我們可以將世界簡單化爲許多到處移動的球,這也正是觀察世界、瞭解世界、以及做計劃並改變世界的第一步。因此,我們認爲這個數據集的應用或將橫跨多個領域,而視覺和機器人技術則是很好的開始。”
麻省理工學院-IBM沃森 AI 實驗室成立於三年前,旨在取得與廣義 AI 主題相關的顛覆性進展。該實驗室如 ObjectNet 等一些成果凸顯了 ImageNet 之類的深度學習成功案例相對薄弱,所以該實驗室已把重心轉向了神經網絡和符號或經典 AI 的結合上。
符號 AI 和神經網絡一樣,已經存在了幾十年之久。考克斯認爲,神經網絡在等待着合適的條件出現,如足夠多的數據和足夠多的計算符號,與此同時 AI 也在等待着神經網絡的發展,以便再度復甦。
考克斯說,這兩種 AI 的互補性很好,如果能夠結合,我們便可以用更少的數據和更高的效能來打造更穩健和更可靠的模型。在年初與 VentureBeat 的一次訪談中,IBM 研究團隊負責人達里奧·吉爾 (Dario Gil) 稱神經符號 AI 將成爲 2020 年最重要的進展之一。
考克斯說,不論你想得到什麼結果,通過神經符號 AI,你都可以表徵知識或程序,而不是像神經網絡那樣映射輸入和輸出。因此,這或許能夠使 AI 更好地幫助我們解決現實世界的問題。
考克斯稱,“谷歌有一條數據之河,亞馬遜也有,這些都不是壞事,但我們絕大多數的問題更像是智力遊戲,所以我們認爲,要向前發展,真正讓 AI 不再是概念上的炒作,我們需要建立能夠實現這一點的系統,這些系統有邏輯組件,可以能夠靈活地重新配置自己,可以根據環境和實驗採取行動,可以解釋這些信息,並擁有其認知世界的內在心理模型”。
麻省理工學院-IBM 沃森 AI 聯合實驗室成立於2017年,總投資2.4 億美元。
原文鏈接: