摘要:随着Alphago的突破,深入的强化学习已成为解决顺序决策问题的公认技术。尽管其声誉,但由于其试验和错误学习机制引起的数据效率低下,使得深层执行学习难以在广泛的领域应用。已经开发了许多用于样本有效的深层增强学习的方法,例如环境建模,经验转移和分布式修改,其中分布式深层掌握学习表明了其在各种应用中的潜力,例如人类计算机游戏和智能运输。在本文中,我们通过比较了经典的分布式深入强化学习方法并研究重要组成部分,以实现有效的分布式学习,从而涵盖了单个玩家单位分布的深度强化学习与最复杂的多个玩家分布深度强化学习。此外,我们回顾了重新发布的工具箱,这些工具箱有助于实现分布的深度强化学习,而无需对其非分发版本进行多次修改。通过分析其优势和劣势,开发和释放了多人多代理的多代理分布式深入强化学习工具箱,这在战争游戏中得到了进一步的验证,这是一个复杂的环境,显示了针对多个玩家的拟议工具盒的可用性,多个代理和多个代理在复杂的游戏下分配了深度强化学习。最后,我们试图指出挑战和未来的趋势,希望这份简短的评论可以为有兴趣分配深入强化学习感兴趣的研究人员提供指南或火花。
主要关键词