MinAtar: An Atari-Inspired Testbed for Thorough and Reproducible Reinforcement Learning Experiments


發表時間:2019
文章要點:這篇文章做了一個簡化版的Atari。現在的Atari game還是太慢了,大家做實驗基本上都跑不超過5個隨機種子,實驗說服力不夠。這篇文章搞了個簡化版,輸入只有1010n的binary的表徵,其中n表示channel(n channels corresponding to game specific objects)。動作從原來的18個縮小到6個。Rewards只有0或者1。當前包含五個遊戲Seaquest, Breakout, Asterix, Freeway and Space Invaders。作者在上面測了DQN和AC

總結:很有意義的事情,確實可以節省很多計算時間。不過目前還很簡陋,遊戲比較少,而且功能只有最基本的。比如沒有clone_state, restore_state的API,沒法恢復狀態,做model-based 算法或者planning的話,只能用deepcopy。
疑問:無。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章