1-1強化學習簡介09:34
1-2強化學習基本概念 09:55
1-3馬爾科夫決策過程 09:06
1-4Bellman方程 12:22
1-5值迭代求解 08:12
1-6代碼實戰求解過程 11:14
1-7QLearning基本原理 10:00
1-8QLearning迭代計算實例 11:07
1-9QLearning迭代效果 08:59
1-10求解流程詳解 11:42
第2章強化學習項目實戰-DQN讓AI自己玩遊戲1小時38分鐘11節
2-1DeepQnetwork原理 06:38
2-2DQN網絡細節 11:00
2-3DQN網絡參數配置 08:23
2-4搭建DQN網絡模型 11:31
2-5DQN卷積操作定義 10:07
2-6數據預處理 11:42
2-7實驗階段數據存儲 08:18
2-8實現訓練模塊 10:50
2-9Debug解讀訓練代碼 05:05
2-10完整代碼流程分析 11:33
2-11DQN效果演示 03:11