今晚直播 |深度强化学习的关键点在哪？世界冠军的干货分享千万不能错过

原創

2020-06-22 19:31

都说强化学习很难，其实掌握了正确的学习方法，也会变得非常简单！

这次，所以我们荣幸的邀请到了百度连续两届获得NeurIPS全球顶会赛事冠军团队，6月16日-6月23日，连续7天，20:30-21:30，以直播的形式，手把手带大家从零实践强化学习！

昨天的课程，科科老师从理论到代码，详细讲解了强化学习核心算法DQN，听了课的小伙伴表示，短短一小时，就把之前看了好几遍都没看懂的原理全弄明白了，科老师的课简直太值得了。

今晚精彩更多

依然是北大最美学霸科科老师，会从策略梯度方法的角度出发，通过类比监督学习、深入讲解代码的方式，带你轻松玩转强化学习。

基于策略梯度方法求解RL

1. 策略近似

2. 详解Policy Gradient算法

3. PARL Policy Gradient代码解析

强化学习研究领域的不同派别，同一个CartPole小游戏还能玩出不一样的花样？重点抢先看：

直播时间

6月19日（今晚）20:30 - 21:30

讲师介绍

百度高级研发工程师科科老师

飞桨强化学习PARL团队核心成员，所在团队曾两度夺得NeurIPS强化学习赛事世界冠军，并获得百度最高奖等荣誉。

快来和世界冠军大佬面对面交流吧~

点击“阅读原文”加入课程，获取更多课程资料哦！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

今晚直播 |深度强化学习的关键点在哪？世界冠军的干货分享千万不能错过