Loading...
机构名称:
¥ 1.0

许多现实世界中的多种应用程序,例如搜索和交通管理或交通管理,都需要协调异性代理的团队。不幸的是,在这样的领域中学习很困难,因为代理通常会融合有限的“可接受”行为,这些行为可能是最佳的。质量多样性方法提供了通过将重点从优化的焦点转移到寻找各种行为曲目来减轻此问题的方法。但是,在具有多种多样且紧密耦合任务的多种环境中,探索行为的整个空间通常是棘手的。代理必须专注于寻找有利于良好团队绩效的有用行为。我们为异构团队(Beht)介绍了行为探索,这是一个多级培训框架,允许系统地探索代理人作为协调团队完成各种任务所需的行为空间。通过使用进化方法的密集代理特定的奖励和团队对象最大化的多样性搜索来搜索,代理的行为空间可以迭代地重新学习,以找到多样化的合作行为。在呼吁各种共同团队行为的多种环境中,我们表明,贝特允许代理商学习各种协同作用,这些协同作用是通过响应环境和其他异质代理而被收购代理行为的多样性所证明的。

平衡团队与质量多样性,用于异质多种协调

平衡团队与质量多样性,用于异质多种协调PDF文件第1页

平衡团队与质量多样性,用于异质多种协调PDF文件第2页

平衡团队与质量多样性,用于异质多种协调PDF文件第3页

平衡团队与质量多样性,用于异质多种协调PDF文件第4页

平衡团队与质量多样性,用于异质多种协调PDF文件第5页

相关文件推荐

2020 年
¥1.0