Horizon：Facebook的应用强化学习平台(PyTorch/Caffe2)

原創

2018-12-11 10:40

【导读】近期，Facebook开源了强化学习平台Horizon，Horizon是用Python构建的，使用PyTorch进行建模和训练，使用Caffe2进行模型服务。

Horizon是一个端到端平台，旨在解决行业应用的RL问题。强化学习在其数据集很大（数百万到数十亿），反馈环路很慢（相对于模拟器）时，必须小心地进行实验，因为它们不在模拟器中运行。与其他通常用于快速原型设计和实验的RL平台不同，Horizon的设计以生产用例为首要考虑因素。该平台包含用于训练流行的深度RL算法的工作流程，包括数据预处理，特征转换，分布式训练，反事实策略评估和优化服务。

支持的算法：

Discrete-Action DQN
Parametric-Action DQ
Double DQN, Dueling DQN, Dueling Double DQN
DDPG
[Soft Actor-Critic] (https://arxiv.org/abs/1801.01290) (SAC)

Github地址：

https://github.com/facebookresearch/Horizon

论文地址：

https://research.fb.com/publications/horizon-facebooks-open-source-applied-reinforcement-learning-platform/

-END-

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Horizon：Facebook的应用强化学习平台(PyTorch/Caffe2)

SQL优化-20231016

【乾貨】計算機也會ps圖片：TL-GAN（附代碼和sildes下載）

【教程】語音識別中的End-to-End模型教程（附178頁PDF全文下載）

《機器學習100天》一份超全機器學習實戰資料，初學者必備！

人工智能產業估值高企

2018年度北京市自然科學基金傑出青年科學基金擬資助項目公佈

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結