今晚直播 |深度強化學習的關鍵點在哪? 世界冠軍的乾貨分享千萬不能錯過


都說強化學習很難,其實掌握了正確的學習方法,也會變得非常簡單!

這次,所以我們榮幸的邀請到了百度連續兩屆獲得NeurIPS全球頂會賽事冠軍團隊,6月16日-6月23日,連續7天,20:30-21:30,以直播的形式,手把手帶大家從零實踐強化學習!

昨天的課程,科科老師從理論到代碼,詳細講解了強化學習核心算法DQN,聽了課的小夥伴表示,短短一小時,就把之前看了好幾遍都沒看懂的原理全弄明白了,科老師的課簡直太值得了。

今晚精彩更多

依然是北大最美學霸科科老師,會從策略梯度方法的角度出發,通過類比監督學習、深入講解代碼的方式,帶你輕鬆玩轉強化學習。

基於策略梯度方法求解RL

1. 策略近似

2. 詳解Policy Gradient算法

3. PARL Policy Gradient代碼解析

強化學習研究領域的不同派別,同一個CartPole小遊戲還能玩出不一樣的花樣?重點搶先看:

直播時間

6月19日(今晚)20:30 - 21:30

講師介紹

百度高級研發工程師 科科老師

飛槳強化學習PARL團隊核心成員,所在團隊曾兩度奪得NeurIPS強化學習賽事世界冠軍,並獲得百度最高獎等榮譽。

快來和世界冠軍大佬面對面交流吧~

點擊“閱讀原文”加入課程,獲取更多課程資料哦!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章