基于Pytorch的强化学习算法实现框架 Torch-RL

Torch-RL

目前 Deep-Reinforcement-learning算法实现框架已经非常多,但是基于 torch的RL实现,简单、易用且附有使用介绍的非常少,我希望建立一个非常简单易用的Torch版的RL框架,可以降低大家的编程成本。让大家快速利用代码来解决自己的问题。
在借鉴了Keras-RL的框架 以及 baseline的实现思路。
当然代码处于初级阶段 目前只实现了DQN,希望各路高手可以加入,一起构建这个环境。

github仓库
https://github.com/zachary2wave/Torch-rl
github仓库
https://github.com/zachary2wave/Torch-rl
github仓库
https://github.com/zachary2wave/Torch-rl
github仓库
https://github.com/zachary2wave/Torch-rl

仓库架构

  • agent
    包含agent(内含与环境交互的过程) 以及 所有算法
  • common
    包含记录文件、loss函数、经验池、DQN策略
  • model
    包含所有深度网络实现
  • savedata
    记录训练结果
    run_xxxxxxxxxxx 训练实例。

目前进展

初始建立框架,借鉴了baseline的 logger文件。

架构方面

整体交互设计完成, 包含模仿学习过程。

算法方面

DQN

支持DDQN、Dueling DQN。

网络方面

可以直接调用函数建立全联接网络。

其他框架结构

其中基于tensorflow框架的有:

  • Baseline:OpenAI提供最为全面的,代码的保证也是最好的。

github地址 baseline(https://github.com/openai/baselines)

OpenAI的介绍(https://spinningup.openai.com/en/latest/index.html)

  • StableBaseline 基于Baseline进行了修改的,有详细的说明文档,相对于baseline 更全面一点。

主页地址 (https://stable-baselines.readthedocs.io/en/master/guide/rl.html)

  • Keras-RL

https://github.com/keras-rl/keras-rl

  • Mofanzhou 提供的代码

https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow

基于Torch的框架:

  • udacity 提供的代码 非常全面

https://github.com/udacity/deep-reinforcement-learning

  • 另一个一个非常全面的库

https://github.com/p-christ/Deep-Reinforcement-Learning-Algorithms-with-PyTorch

  • 还有一个

https://torchrl.sanyamkapoor.com/

​ 其余的一些实现

​ https://github.com/lgvaz/reward

​ https://torchrl.readthedocs.io/en/master/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章