Loading...
机构名称:
¥ 3.0

强化学习(RL)是优化长期目标的多功能框架。尽管可以使用RL正式化许多现实世界中的问题,但是学习和部署表现的RL策略需要一个旨在应对几个重要挑战的系统,包括勘探 - 诠释困境,部分可观察性,动态动作空间和安全问题。尽管这些挑战的重要性已得到充分认可,但现有的开源RL库并未明确解决它们。本文介绍了Pearl,这是一个准备生产的RL软件包,旨在以模块化的方式拥抱这些挑战。除了提出基准测试结果外,我们还重点介绍了Pearl持续采用的示例,以证明其在生产用例中的优势。Pearl在github上的github.com/facebookresearch/pearl及其官方网站是pearlagent.github.io。关键字:加固学习,开源软件,Python,Pytorch

PEARL:准备生产的加固学习代理

PEARL:准备生产的加固学习代理PDF文件第1页

PEARL:准备生产的加固学习代理PDF文件第2页

PEARL:准备生产的加固学习代理PDF文件第3页

PEARL:准备生产的加固学习代理PDF文件第4页

PEARL:准备生产的加固学习代理PDF文件第5页