都说强化学习很难,其实掌握了正确的学习方法,也会变得非常简单!
这次,所以我们荣幸的邀请到了百度连续两届获得NeurIPS全球顶会赛事冠军团队,6月16日-6月23日,连续7天,20:30-21:30,以直播的形式,手把手带大家从零实践强化学习!
昨天的课程,科科老师从理论到代码,详细讲解了强化学习核心算法DQN,听了课的小伙伴表示,短短一小时,就把之前看了好几遍都没看懂的原理全弄明白了,科老师的课简直太值得了。
今晚精彩更多
依然是北大最美学霸科科老师,会从策略梯度方法的角度出发,通过类比监督学习、深入讲解代码的方式,带你轻松玩转强化学习。
基于策略梯度方法求解RL
1. 策略近似
2. 详解Policy Gradient算法
3. PARL Policy Gradient代码解析
强化学习研究领域的不同派别,同一个CartPole小游戏还能玩出不一样的花样?重点抢先看:
直播时间
6月19日(今晚)20:30 - 21:30
讲师介绍
百度高级研发工程师 科科老师
飞桨强化学习PARL团队核心成员,所在团队曾两度夺得NeurIPS强化学习赛事世界冠军,并获得百度最高奖等荣誉。
快来和世界冠军大佬面对面交流吧~
点击“阅读原文”加入课程,获取更多课程资料哦!