台部落

Paper-6 精讀 Deep Visuomotor Policies (2016 JMLR)

2020-06-16 16:27:39

Paper-1 精讀GAIL 2016 NIPS

2020-06-16 16:27:39

Paper-2 精讀GPS (2014 NIPS)

2020-06-16 16:27:38

Paper-7 精讀AIRL Learn Robust Reward （2018 ICLR）

2020-06-16 16:27:31

第六章函數逼近-強化學習理論學習與代碼實現（強化學習導論第二版）

松间沙路hba646333407

2020-06-16 03:30:17

第五章基於時序差分和Q學習的無模型預測與控制-強化學習理論學習與代碼實現（強化學習導論第二版）

松间沙路hba646333407

2020-06-16 03:30:17

第十二章演員評論家（Actor-Critic）-強化學習理論學習與代碼實現（強化學習導論第二版）

松间沙路hba646333407

2020-06-16 03:30:17

【Tensorlayer系列】深度強化學習之FrozenLake介紹及表格型Q學習求解

松间沙路hba646333407

2020-06-16 03:30:17

第十一章策略梯度（Policy Gradient）-強化學習理論學習與代碼實現（強化學習導論第二版）

松间沙路hba646333407

2020-06-16 03:30:17

強化學習入門與實踐系列—0.強化學習序論

2020-06-07 16:49:40

David Silver深度強化學習第1課- intro-RL

2020-06-07 16:49:40

深度強化學習系列(1): 深度強化學習概述

2020-06-01 01:44:08

深度強化學習系列(16): 從DPG到DDPG算法的原理講解及tensorflow代碼實現

2020-06-01 01:44:08

深度強化學習系列(6): DQN原理及實現

2020-06-01 01:44:08

深度強化學習系列(13): 策略梯度（Policy Gradient）

2020-06-01 01:44:08

1 2 3 4 5 6 7 8 9 10