基于Pytorch的强化学习算法实现框架 Torch-RL

原創

2020-02-24 20:47

Torch-RL

目前 Deep-Reinforcement-learning算法实现框架已经非常多，但是基于 torch的RL实现，简单、易用且附有使用介绍的非常少，我希望建立一个非常简单易用的Torch版的RL框架，可以降低大家的编程成本。让大家快速利用代码来解决自己的问题。
在借鉴了Keras-RL的框架以及 baseline的实现思路。
当然代码处于初级阶段目前只实现了DQN，希望各路高手可以加入，一起构建这个环境。

github仓库
https://github.com/zachary2wave/Torch-rl
github仓库
https://github.com/zachary2wave/Torch-rl
github仓库
https://github.com/zachary2wave/Torch-rl
github仓库
https://github.com/zachary2wave/Torch-rl

仓库架构

agent
包含agent（内含与环境交互的过程）以及所有算法
common
包含记录文件、loss函数、经验池、DQN策略
model
包含所有深度网络实现
savedata
记录训练结果
run_xxxxxxxxxxx 训练实例。

目前进展

初始建立框架，借鉴了baseline的 logger文件。

架构方面

整体交互设计完成，包含模仿学习过程。

算法方面

DQN

支持DDQN、Dueling DQN。

网络方面

可以直接调用函数建立全联接网络。

其他框架结构

其中基于tensorflow框架的有：

Baseline：OpenAI提供最为全面的，代码的保证也是最好的。

github地址 baseline(https://github.com/openai/baselines)

OpenAI的介绍（https://spinningup.openai.com/en/latest/index.html）

StableBaseline 基于Baseline进行了修改的，有详细的说明文档，相对于baseline 更全面一点。

主页地址（https://stable-baselines.readthedocs.io/en/master/guide/rl.html）

Keras-RL

https://github.com/keras-rl/keras-rl

Mofanzhou 提供的代码

https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow

基于Torch的框架：

udacity 提供的代码非常全面

https://github.com/udacity/deep-reinforcement-learning

另一个一个非常全面的库

https://github.com/p-christ/Deep-Reinforcement-Learning-Algorithms-with-PyTorch

还有一个

https://torchrl.sanyamkapoor.com/

其余的一些实现

https://github.com/lgvaz/reward

https://torchrl.readthedocs.io/en/master/

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

基于Pytorch的强化学习算法实现框架 Torch-RL

Torch-RL

仓库架构

目前进展

架构方面

算法方面

DQN

网络方面

其他框架结构

前端使用 Konva 实现可视化设计器（13）- 折线 - 最优路径应用【思路篇】

基於Pytorch的強化學習算法實現框架 Torch-RL

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結