Loading...
机构名称:
¥ 2.0

摘要。尽管在为一般网络物理系统指定和学习目标方面取得了显着进展,但将这些方法应用于分离的多机构系统仍然带来了显着的挑战。在其中需要(a)允许表达和相互影响的本地和全球目标的工艺规范基础,(b)在州和行动空间中驯服的爆炸以实现有效的学习,以及(c)最小化协调频率的频率以及参与参与者的全球目标。为了应对这些挑战,我们提出了一个新颖的规范框架,该框架允许自然地统计用于指导多代理系统培训的本地和全球目标。我们的技术使学习表达性策略允许代理商以无协调的方式为本地目标运作,同时使用连接的通信协议来强制执行全局。实验结果支持我们的主张,即可以使用特定指导的学习有效地实现复杂的多代理分布式计划问题。代码可在https://github.com/yokian/distspectrl上提供。

distspectrl:在多代理中分发规格...

distspectrl:在多代理中分发规格...PDF文件第1页

distspectrl:在多代理中分发规格...PDF文件第2页

distspectrl:在多代理中分发规格...PDF文件第3页

distspectrl:在多代理中分发规格...PDF文件第4页

distspectrl:在多代理中分发规格...PDF文件第5页

相关文件推荐

2017 年
¥49.0