基於Pytorch的強化學習算法實現框架 Torch-RL

Torch-RL

目前 Deep-Reinforcement-learning算法實現框架已經非常多,但是基於 torch的RL實現,簡單、易用且附有使用介紹的非常少,我希望建立一個非常簡單易用的Torch版的RL框架,可以降低大家的編程成本。讓大家快速利用代碼來解決自己的問題。
在借鑑了Keras-RL的框架 以及 baseline的實現思路。
當然代碼處於初級階段 目前只實現了DQN,希望各路高手可以加入,一起構建這個環境。

github倉庫
https://github.com/zachary2wave/Torch-rl
github倉庫
https://github.com/zachary2wave/Torch-rl
github倉庫
https://github.com/zachary2wave/Torch-rl
github倉庫
https://github.com/zachary2wave/Torch-rl

倉庫架構

  • agent
    包含agent(內含與環境交互的過程) 以及 所有算法
  • common
    包含記錄文件、loss函數、經驗池、DQN策略
  • model
    包含所有深度網絡實現
  • savedata
    記錄訓練結果
    run_xxxxxxxxxxx 訓練實例。

目前進展

初始建立框架,借鑑了baseline的 logger文件。

架構方面

整體交互設計完成, 包含模仿學習過程。

算法方面

DQN

支持DDQN、Dueling DQN。

網絡方面

可以直接調用函數建立全聯接網絡。

其他框架結構

其中基於tensorflow框架的有:

  • Baseline:OpenAI提供最爲全面的,代碼的保證也是最好的。

github地址 baseline(https://github.com/openai/baselines)

OpenAI的介紹(https://spinningup.openai.com/en/latest/index.html)

  • StableBaseline 基於Baseline進行了修改的,有詳細的說明文檔,相對於baseline 更全面一點。

主頁地址 (https://stable-baselines.readthedocs.io/en/master/guide/rl.html)

  • Keras-RL

https://github.com/keras-rl/keras-rl

  • Mofanzhou 提供的代碼

https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow

基於Torch的框架:

  • udacity 提供的代碼 非常全面

https://github.com/udacity/deep-reinforcement-learning

  • 另一個一個非常全面的庫

https://github.com/p-christ/Deep-Reinforcement-Learning-Algorithms-with-PyTorch

  • 還有一個

https://torchrl.sanyamkapoor.com/

​ 其餘的一些實現

​ https://github.com/lgvaz/reward

​ https://torchrl.readthedocs.io/en/master/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章