【導讀】 從三月中旬開始到現在,歷時整整兩個多月時間,每週錄製和剪輯一課視頻,週末至少投入大半天時間,周博磊大牛終於獨自一人把這門《強化學習綱要》整理完成。這可能也是全網第一個中文強化學習課程。超級贊,感謝大牛的課程分享,下面視頻齊刷刷放一起,還沒看的各位RLer們,快去看起來!(文末附視頻鏈接和課件打包下載!)
個人簡介
周博磊: 2010年本科畢業於上海交通大學,2012年碩士畢業於香港中文大學,2018年博士畢業於麻省理工學院,現任香港中文大學信息工程系助理教授。
研究方向主要爲機器感知和決策,重點是通過學習可解釋、結構化的表徵,使機器能夠在複雜的環境中感知、推理和行動。
獲獎榮譽:
-
MIT Technology Review 2020年亞太地區35歲以下的創新者
-
Facebook PyRobot:Democratizing Robotics Research Award2019
-
Facebook博士2016-2018年計算機視覺研究金
-
2017年BRC獎學金
-
麻省理工學院Ho-Ching and Han-Ching Fund Award 2013
-
麻省理工學院大中華計算機科學獎學金2013
-
香港中文大學2012年度傑出論文獎
-
2011年微軟亞洲研究金
-
香港中文大學研究生獎學金2010-2012
-
上海交通大學2010年度優秀本科生論文
更多信息,詳見個人主頁:http://bzhou.ie.cuhk.edu.hk/
強化學習課程目錄
-
概括與基礎
-
馬爾科夫決策過程
-
無模型的價值函數估計和控制
-
價值函數的近似
-
策略優化基礎
-
策略優化進階
-
基於環境模型的 RL 方法
-
模仿學習
-
RL 分佈式系統
-
完結篇
部分課件pdf展示
傳送門下載
爲了方便大家學習,我已將所有課程PPT打包下載好!請關注深度學習技術前沿公衆號
- 後臺回覆“RL2020” 就可以獲取**《港中文周博磊強化學習綱要》視頻鏈接和課程PPT資料**
歡迎各位RLer加入強化學習微信交流大羣,本羣旨在交流強化學習框架、策略梯度、DQN、理論推導與算法實現、前沿技術與頂會文章解讀、應用場景等內容。更有求職內推、算法競賽、資源乾貨、業界前沿資訊等,歡迎加羣交流學習!
進羣請備註:研究方向+學校/公司+暱稱(如強化學習+上交+王明)