Horizon:Facebook的应用强化学习平台(PyTorch/Caffe2)

【导读】近期,Facebook开源了强化学习平台Horizon,Horizon是用Python构建的,使用PyTorch进行建模和训练,使用Caffe2进行模型服务。

Horizon是一个端到端平台,旨在解决行业应用的RL问题。强化学习在其数据集很大(数百万到数十亿),反馈环路很慢(相对于模拟器)时,必须小心地进行实验,因为它们不在模拟器中运行。 与其他通常用于快速原型设计和实验的RL平台不同,Horizon的设计以生产用例为首要考虑因素。 该平台包含用于训练流行的深度RL算法的工作流程,包括数据预处理,特征转换,分布式训练,反事实策略评估和优化服务。

支持的算法:

  • Discrete-Action DQN
  • Parametric-Action DQ
  • Double DQN, Dueling DQN, Dueling Double DQN
  • DDPG
  • [Soft Actor-Critic] (https://arxiv.org/abs/1801.01290) (SAC)

Github地址:

https://github.com/facebookresearch/Horizon

论文地址:

https://research.fb.com/publications/horizon-facebooks-open-source-applied-reinforcement-learning-platform/

-END-

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章