基於Pytorch的強化學習算法實現框架 Torch-RL

原創

2020-02-24 20:47

Torch-RL

目前 Deep-Reinforcement-learning算法實現框架已經非常多，但是基於 torch的RL實現，簡單、易用且附有使用介紹的非常少，我希望建立一個非常簡單易用的Torch版的RL框架，可以降低大家的編程成本。讓大家快速利用代碼來解決自己的問題。
在借鑑了Keras-RL的框架以及 baseline的實現思路。
當然代碼處於初級階段目前只實現了DQN，希望各路高手可以加入，一起構建這個環境。

github倉庫
https://github.com/zachary2wave/Torch-rl
github倉庫
https://github.com/zachary2wave/Torch-rl
github倉庫
https://github.com/zachary2wave/Torch-rl
github倉庫
https://github.com/zachary2wave/Torch-rl

倉庫架構

agent
包含agent（內含與環境交互的過程）以及所有算法
common
包含記錄文件、loss函數、經驗池、DQN策略
model
包含所有深度網絡實現
savedata
記錄訓練結果
run_xxxxxxxxxxx 訓練實例。

目前進展

初始建立框架，借鑑了baseline的 logger文件。

架構方面

整體交互設計完成，包含模仿學習過程。

算法方面

DQN

支持DDQN、Dueling DQN。

網絡方面

可以直接調用函數建立全聯接網絡。

其他框架結構

其中基於tensorflow框架的有：

Baseline：OpenAI提供最爲全面的，代碼的保證也是最好的。

github地址 baseline(https://github.com/openai/baselines)

OpenAI的介紹（https://spinningup.openai.com/en/latest/index.html）

StableBaseline 基於Baseline進行了修改的，有詳細的說明文檔，相對於baseline 更全面一點。

主頁地址（https://stable-baselines.readthedocs.io/en/master/guide/rl.html）

Keras-RL

https://github.com/keras-rl/keras-rl

Mofanzhou 提供的代碼

https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow

基於Torch的框架：

udacity 提供的代碼非常全面

https://github.com/udacity/deep-reinforcement-learning

另一個一個非常全面的庫

https://github.com/p-christ/Deep-Reinforcement-Learning-Algorithms-with-PyTorch

還有一個

https://torchrl.sanyamkapoor.com/

其餘的一些實現

https://github.com/lgvaz/reward

https://torchrl.readthedocs.io/en/master/

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

基於Pytorch的強化學習算法實現框架 Torch-RL

Torch-RL

倉庫架構

目前進展

架構方面

算法方面

DQN

網絡方面

其他框架結構

如何使用 JS 判斷用戶是否處於活躍狀態

Mono 支持LoongArch架構

lightdb秒級增加列和刪除列（not null帶默認值）

lightdb數據庫超時相關控制參數

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

❤️‍🔥 Solon Cloud Event 新的事務特性與應用

網絡爬蟲的祕密：如何高效地抓取JD.com視頻鏈接

lightdb mysql 8.0兼容之不可見主鍵

使用 JS 實現在瀏覽器控制檯打印圖片 console.image()

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（四）使用域名訪問網站應用

基於Pytorch的強化學習算法實現框架 Torch-RL

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結