Torch-RL
目前 Deep-Reinforcement-learning算法實現框架已經非常多,但是基於 torch的RL實現,簡單、易用且附有使用介紹的非常少,我希望建立一個非常簡單易用的Torch版的RL框架,可以降低大家的編程成本。讓大家快速利用代碼來解決自己的問題。
在借鑑了Keras-RL的框架 以及 baseline的實現思路。
當然代碼處於初級階段 目前只實現了DQN,希望各路高手可以加入,一起構建這個環境。
github倉庫
https://github.com/zachary2wave/Torch-rl
github倉庫
https://github.com/zachary2wave/Torch-rl
github倉庫
https://github.com/zachary2wave/Torch-rl
github倉庫
https://github.com/zachary2wave/Torch-rl
倉庫架構
- agent
包含agent(內含與環境交互的過程) 以及 所有算法 - common
包含記錄文件、loss函數、經驗池、DQN策略 - model
包含所有深度網絡實現 - savedata
記錄訓練結果
run_xxxxxxxxxxx 訓練實例。
目前進展
初始建立框架,借鑑了baseline的 logger文件。
架構方面
整體交互設計完成, 包含模仿學習過程。
算法方面
DQN
支持DDQN、Dueling DQN。
網絡方面
可以直接調用函數建立全聯接網絡。
其他框架結構
其中基於tensorflow框架的有:
- Baseline:OpenAI提供最爲全面的,代碼的保證也是最好的。
github地址 baseline(https://github.com/openai/baselines)
OpenAI的介紹(https://spinningup.openai.com/en/latest/index.html)
- StableBaseline 基於Baseline進行了修改的,有詳細的說明文檔,相對於baseline 更全面一點。
主頁地址 (https://stable-baselines.readthedocs.io/en/master/guide/rl.html)
- Keras-RL
https://github.com/keras-rl/keras-rl
- Mofanzhou 提供的代碼
https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow
基於Torch的框架:
- udacity 提供的代碼 非常全面
https://github.com/udacity/deep-reinforcement-learning
- 另一個一個非常全面的庫
https://github.com/p-christ/Deep-Reinforcement-Learning-Algorithms-with-PyTorch
- 還有一個
https://torchrl.sanyamkapoor.com/
其餘的一些實現
https://github.com/lgvaz/reward
https://torchrl.readthedocs.io/en/master/