都說強化學習很難,其實掌握了正確的學習方法,也會變得非常簡單!
這次,所以我們榮幸的邀請到了百度連續兩屆獲得NeurIPS全球頂會賽事冠軍團隊,6月16日-6月23日,連續7天,20:30-21:30,以直播的形式,手把手帶大家從零實踐強化學習!
昨天的課程,科科老師從理論到代碼,詳細講解了強化學習核心算法DQN,聽了課的小夥伴表示,短短一小時,就把之前看了好幾遍都沒看懂的原理全弄明白了,科老師的課簡直太值得了。
今晚精彩更多
依然是北大最美學霸科科老師,會從策略梯度方法的角度出發,通過類比監督學習、深入講解代碼的方式,帶你輕鬆玩轉強化學習。
基於策略梯度方法求解RL
1. 策略近似
2. 詳解Policy Gradient算法
3. PARL Policy Gradient代碼解析
強化學習研究領域的不同派別,同一個CartPole小遊戲還能玩出不一樣的花樣?重點搶先看:
直播時間
6月19日(今晚)20:30 - 21:30
講師介紹
百度高級研發工程師 科科老師
飛槳強化學習PARL團隊核心成員,所在團隊曾兩度奪得NeurIPS強化學習賽事世界冠軍,並獲得百度最高獎等榮譽。
快來和世界冠軍大佬面對面交流吧~
點擊“閱讀原文”加入課程,獲取更多課程資料哦!