Loading...
机构名称:
¥ 2.0

进化增强学习(EVORL)已成为一种有前途的方法,可以通过将进化计算(EC)与RL整合(EC)范式来克服传统强化学习(RL)的局限性。但是,基于人群的EC的性质大大提高了计算成本,从而限制了大规模设置中算法设计选择和可扩展性的探索。为了应对这一挑战,我们介绍了Evorl 1,这是针对GPU加速的第一个端到端EVORL框架。该框架对加速器(包括环境模拟和EC过程)执行了整个培训管道,通过矢量化和编译技术利用层次并行性,以实现较高的速度和可扩展性。此设计可以在一台计算机上进行有效培训。In addition to its performance-oriented design, EvoRL offers a comprehensive platform for EvoRL research, encompassing implementations of traditional RL algorithms (e.g., A2C, PPO, DDPG, TD3, SAC), Evolutionary Algorithms (e.g., CMA-ES, OpenES, ARS), and hybrid EvoRL paradigms such as Evolutionary-guided RL (例如,ERL,CEM-RL)和基于群体的自动(例如PBT)。该框架的模块化体系结构和用户友好的接口使研究人员可以无缝整合新组件,自定义算法并进行公平的基准测试和消融研究。该项目是开源的,可在以下网址找到:https://github.com/emi-group/evorl。

evorl:一个GPU加速框架,用于进化增强学习

evorl:一个GPU加速框架,用于进化增强学习PDF文件第1页

evorl:一个GPU加速框架,用于进化增强学习PDF文件第2页

evorl:一个GPU加速框架,用于进化增强学习PDF文件第3页

evorl:一个GPU加速框架,用于进化增强学习PDF文件第4页

evorl:一个GPU加速框架,用于进化增强学习PDF文件第5页

相关文件推荐

2024 年
¥1.0
1900 年
¥1.0
2024 年
¥5.0
2019 年
¥3.0