强化学习入坑总结

原創

2021-12-25 21:10

总结一下自己入坑强化学习的经验。

在入坑之前，自己对强化学习基本一无所知，所以对于强化学习的学习基本上是从零开始。

下面总结一下自己学习强化学习所看的网课，教材，论文，代码

莫烦的强化学习教程。这个教程真的是通俗易懂，完全针对初学者，也有配套的代码。不过讲解的内容不是很深。快速看一遍就行，形成对强化学习的一个基本认识。他的代码是tensorflow的，我还是更喜欢Pytorch一些。
David Silver的课程。这个课程不算有难度，从MDP开始讲也是最适合初学者的，看完之后基本对强化学习的整个体系有了清晰的认知。这门课的侧重点还是传统强化学习的基本理论和概念，也是非看不可的课程。
李宏毅的强化学习课程这门课基本上就是对DRL几个算法的具体介绍，可以作为一个补充看一下，不是非看不可。
cs294|cs285 这门课应该是非看不可的课，也是一门有难度的课，课程网站上也有相应的project可以做。内容上偏重policy gradient。建议看完David Silver的课程之后再看。

《Reinforcement Learning： an Introduction》:这本书的中文第二版也出来了，不过英文版读起来也不费事。David Silver 的课程就是根据这本教材设计的。书中包含的内容十分丰富，不过也主要是传统强化学习中的内容。个人还是建议看一下，毕竟是强化学习的圣经，看完之后会对强化学习的整个体系有一个更加清晰的认识。

论文基础部分就是看openAI 提供的key papers 入门的话就是看一下第一部分Model free 的前a,b,c小结的17篇文章。

GitHub 上有很多优秀的强化学习论文的代码。个人建议是使用pytorch ,因为代码更容易阅读，对初学者也更友好。下面列两个自己看的。

代码基本作为阅读学习使用。基本没有包含trick。

完成上面相关内容的学习，基本就算是入门了，入门之后就全靠自己去学习，去探索了。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.