Reverb: A Framework For Experience Replay
发表时间:2021
文章要点:这篇文章主要是设计了一个用来做experience replay的框架Reverb,主要是把experience replay扩展到了分布式和多台机器上(Reverb is designed to work efficiently in distributed configurations with up to thousands of concurrent clients.)。大概的思路就是把data generators (actors)和data consumers (learners)都搞到多台机器上了,然后数据的存储上做了一些压缩,同时检索的性能以及采样的性能都做了对应的实现。
总结:本来不打算看框架之类的,不过一看是deepmind发的,还是看看比较好。
疑问:里面设计了很多计算机方面的术语,看不大懂。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
Dokcer部署Kafka集群
zer0black
2024-05-16 14:31:24
「Pygors跨平台GUI」2:安装MinGW-w64、MSYS2还是WSL2
windfic
2024-05-16 14:29:14
「Pygors跨平台GUI」1:Pygors跨平台GUI应用研究
windfic
2024-05-16 14:29:14
【Linux命令学习】lsof查看打开的文件
金大鑫要堅持
2024-05-16 14:27:04
MacOS添加,查看,删除用户
金大鑫要堅持
2024-05-16 14:27:04
Garnet:微软官方基于.NET开源的高性能分布式缓存存储数据库
追逐時光
2024-05-16 14:22:03
nodejs学习07——API
htj10
2024-05-16 14:21:53
🔥 Java Solon v2.7.6 发布
劉之西東
2024-05-16 14:21:13
Puppeteer!
CharyGao
2024-05-16 14:17:02
openstack虚拟机用keep alive添加的VIP,其它机器无法访问
馬昌偉
2024-05-16 14:13:52
apisix~authz-keycloak插件介绍
張佔嶺
2024-05-16 14:12:42
Dynamic-Datasource动态数据源
擾擾
2024-05-16 14:12:02
最新文章
-
RETROFORMER: RETROSPECTIVE LARGE LANGUAGE AGENTS WITH POLICY GRADIENT OPTIMIZATION
-
REACT: SYNERGIZING REASONING AND ACTING IN LANGUAGE MODELS
-
Reflexion: Language Agents with Verbal Reinforcement Learning
-
Large Language Models Are Semi-Parametric Reinforcement Learning Agents
-
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems