adaptaug:多代理增强学习
机构名称:
¥ 1.0

摘要 - 多代理强化学习已成为控制多机器人系统的一种有希望的方法。尽管如此,MARL的样本效率低,这是其在机器人技术中更广泛应用的重要障碍。虽然数据增强似乎是提高样品效率的直接解决方案,但它通常会导致训练不稳定,从而使样本效率变得更糟。此外,手动为各种任务选择合适的增强是一个繁琐而耗时的过程。为了缓解这些挑战,我们的研究理论上分析了数据增强对MARL算法的含义。在这些信息的指导下,我们提出了Adaptaug,这是一个自适应框架,旨在选择性地识别有益的数据增强,从而实现了多机器人任务的卓越样本效率和整体性能。在模拟和现实世界多机器人方案中的广泛实验验证了我们提出的框架的有效性。

adaptaug:多代理增强学习

adaptaug:多代理增强学习PDF文件第1页

adaptaug:多代理增强学习PDF文件第2页

adaptaug:多代理增强学习PDF文件第3页

adaptaug:多代理增强学习PDF文件第4页

adaptaug:多代理增强学习PDF文件第5页

相关文件推荐