强化学习入坑总结

总结一下自己入坑强化学习的经验。

在入坑之前,自己对强化学习基本一无所知,所以对于强化学习的学习基本上是从零开始。

下面总结一下自己学习强化学习所看的网课,教材,论文,代码

网课

  • 莫烦的强化学习教程。这个教程真的是通俗易懂,完全针对初学者,也有配套的代码。不过讲解的内容不是很深。快速看一遍就行,形成对强化学习的一个基本认识。他的代码是tensorflow的,我还是更喜欢Pytorch一些。
  • David Silver的课程。这个课程不算有难度,从MDP开始讲也是最适合初学者的,看完之后基本对强化学习的整个体系有了清晰的认知。这门课的侧重点还是传统强化学习的基本理论和概念,也是非看不可的课程。
  • 李宏毅的强化学习课程 这门课基本上就是对DRL几个算法的具体介绍,可以作为一个补充看一下,不是非看不可。
  • cs294|cs285 这门课应该是非看不可的课,也是一门有难度的课,课程网站上也有相应的project可以做。内容上偏重policy gradient。建议看完David Silver的课程之后再看。

教材

  • 《Reinforcement Learning: an Introduction》:这本书的中文第二版也出来了,不过英文版读起来也不费事。David Silver 的课程就是根据这本教材设计的。书中包含的内容十分丰富,不过也主要是传统强化学习中的内容。个人还是建议看一下,毕竟是强化学习的圣经,看完之后会对强化学习的整个体系有一个更加清晰的认识。

论文

论文基础部分就是看openAI 提供的key papers 入门的话就是看一下第一部分Model free 的前a,b,c小结的17篇文章。

代码

GitHub 上有很多优秀的强化学习论文的代码。个人建议是使用pytorch ,因为代码更容易阅读,对初学者也更友好。下面列两个自己看的。

代码基本作为阅读学习使用。基本没有包含trick。

完成上面相关内容的学习,基本就算是入门了,入门之后就全靠自己去学习,去探索了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章