OpenAI今天宣佈推出Spinning Up,這是一個旨在教授任何深度強化學習的計劃。
OpenAI以在虛擬環境中製作看似時髦的代理而聞名,這些代理學習如何自行走,例如與華盛頓大學合作的Humanoid v2或POLO。
強化學習包括在激勵的環境中向代理提供獎勵信號,以最大化其獎勵以實現目標。
RL在主要的AI突破中發揮了作用,例如Google DeepMind的AlphaGo和在Dota 2等環境中受過培訓的代理商。
Spinning Up包括一系列重要的強化學習研究論文,理解RL所必需的術語表,以及一系列運行練習的算法。
該計劃的目的不僅是幫助人們瞭解強化學習是如何運作的,而且是爲了通過讓更多來自計算機科學領域的人蔘與安全地創建人工智能(AGI)來實現OpenAI的總體目標。
“解決人工智能安全問題需要具備廣泛專業知識和觀點的人才,許多相關專業與工程或計算機科學毫無關聯。儘管如此,所涉及的每個人都需要充分了解技術以做出明智的決策,以及需要的幾個Spinning Up地址,“根據Spinning Up文檔文本。
通過與OpenAI學者和研究員合作獲得Spinning Up,他們對AI有着好奇的興趣,但在該領域缺乏經驗。
除了在安全部署AGI的目標方面取得進展之外,該計劃的創建是因爲目前沒有單一的教科書可以提供實施強化學習所需的知識; 目前的知識被鎖定在一系列不同的講座和有影響力的研究論文中。
“所以我們這裏的套餐旨在成爲那些深受RL激動的人們的缺失中間步驟,並希望學習如何使用它或做出貢獻,但是沒有明確的學習內容或如何將算法轉化爲代碼。我們試圖使這個作爲一個有用的啓動點,“ 項目頁面讀取。
Spinning Up計劃是OpenAI打算提供的更多教育服務的一部分。Spinning Up研討會將於2019年2月舉行,另一個研討會將與 加州大學伯克利分校的人類兼容AI(CHAI)中心共同舉辦。