许多现实世界中的多种应用程序,例如搜索和交通管理或交通管理,都需要协调异性代理的团队。不幸的是,在这样的领域中学习很困难,因为代理通常会融合有限的“可接受”行为,这些行为可能是最佳的。质量多样性方法提供了通过将重点从优化的焦点转移到寻找各种行为曲目来减轻此问题的方法。但是,在具有多种多样且紧密耦合任务的多种环境中,探索行为的整个空间通常是棘手的。代理必须专注于寻找有利于良好团队绩效的有用行为。我们为异构团队(Beht)介绍了行为探索,这是一个多级培训框架,允许系统地探索代理人作为协调团队完成各种任务所需的行为空间。通过使用进化方法的密集代理特定的奖励和团队对象最大化的多样性搜索来搜索,代理的行为空间可以迭代地重新学习,以找到多样化的合作行为。在呼吁各种共同团队行为的多种环境中,我们表明,贝特允许代理商学习各种协同作用,这些协同作用是通过响应环境和其他异质代理而被收购代理行为的多样性所证明的。
摘要。量化深度学习模型预测中的不确定性有助于解释它们,从而有助于它们在关键领域的接受。然而,当前的标准方法依赖于多步骤方法,这增加了推理时间和内存成本。在临床常规中,自动预测必须融入临床咨询时间范围,这就需要更快、更有效的不确定性量化方法。在这项工作中,我们提出了一种名为 BEHT 的新模型,并在多发性硬化症 (MS) 患者 T2 加权 FLAIR MRI 序列白质高信号的自动分割任务中对其进行了评估。我们证明,这种方法输出预测不确定性的速度比最先进的蒙特卡洛 Dropout 方法快得多,而且准确度相似,甚至略高。有趣的是,我们的方法区分了两种不同的不确定性来源,即随机不确定性和认知不确定性。