撒花!港中文周博磊--強化學習課程完結(附課件下載!)

【導讀】 從三月中旬開始到現在,歷時整整兩個多月時間,每週錄製和剪輯一課視頻,週末至少投入大半天時間,周博磊大牛終於獨自一人把這門《強化學習綱要》整理完成。這可能也是全網第一個中文強化學習課程。超級贊,感謝大牛的課程分享,下面視頻齊刷刷放一起,還沒看的各位RLer們,快去看起來!(文末附視頻鏈接和課件打包下載!)

image

image

個人簡介

周博磊: 2010年本科畢業於上海交通大學,2012年碩士畢業於香港中文大學,2018年博士畢業於麻省理工學院,現任香港中文大學信息工程系助理教授。

研究方向主要爲機器感知和決策,重點是通過學習可解釋、結構化的表徵,使機器能夠在複雜的環境中感知、推理和行動。

獲獎榮譽:

  1. MIT Technology Review 2020年亞太地區35歲以下的創新者

  2. Facebook PyRobot:Democratizing Robotics Research Award2019

  3. Facebook博士2016-2018年計算機視覺研究金

  4. 2017年BRC獎學金

  5. 麻省理工學院Ho-Ching and Han-Ching Fund Award 2013

  6. 麻省理工學院大中華計算機科學獎學金2013

  7. 香港中文大學2012年度傑出論文獎

  8. 2011年微軟亞洲研究金

  9. 香港中文大學研究生獎學金2010-2012

  10. 上海交通大學2010年度優秀本科生論文

更多信息,詳見個人主頁:http://bzhou.ie.cuhk.edu.hk/

強化學習課程目錄

  1. 概括與基礎

  2. 馬爾科夫決策過程

  3. 無模型的價值函數估計和控制

  4. 價值函數的近似

  5. 策略優化基礎

  6. 策略優化進階

  7. 基於環境模型的 RL 方法

  8. 模仿學習

  9. RL 分佈式系統

  10. 完結篇

image

部分課件pdf展示

image

image

image

image

傳送門下載

爲了方便大家學習,我已將所有課程PPT打包下載好!請關注深度學習技術前沿公衆號

  • 後臺回覆“RL2020” 就可以獲取**《港中文周博磊強化學習綱要》視頻鏈接和課程PPT資料**
重磅!DLer-強化學習交流羣已成立!

歡迎各位RLer加入強化學習微信交流大羣,本羣旨在交流強化學習框架、策略梯度、DQN、理論推導與算法實現、前沿技術與頂會文章解讀、應用場景等內容。更有求職內推、算法競賽、資源乾貨、業界前沿資訊等,歡迎加羣交流學習!

進羣請備註:研究方向+學校/公司+暱稱(如強化學習+上交+王明)

image

👆 長按識別,即可邀請您進羣!
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章