Loading...
机构名称:
¥ 1.0

我们为结构化限制提出了一个新颖的框架,我们称之为影响图匪。我们的框架使用图形模型来捕获动作,潜在变量和观察之间的复杂统计依赖性;因此,统一并扩展了许多现有的模型,例如共同的半伴侣,级联的匪徒和低级匪徒。我们开发了新颖的在线学习算法,这些算法学会在模型中有效地行事。关键思想是要跟踪模型参数的结构化分布,无论是外部还是大约。采取行动,我们将模型参数从其后部进行采样,然后使用影响图的结构来发现采样参数下最乐观的动作。我们在三个结构化的匪徒问题中凭经验评估了我们的算法,并表明它们的性能与特定问题的最新基准相比,它们的性能和更好或更好。

图形模型符合匪徒:变异的汤普森采样方法

图形模型符合匪徒:变异的汤普森采样方法PDF文件第1页

图形模型符合匪徒:变异的汤普森采样方法PDF文件第2页

图形模型符合匪徒:变异的汤普森采样方法PDF文件第3页

图形模型符合匪徒:变异的汤普森采样方法PDF文件第4页

图形模型符合匪徒:变异的汤普森采样方法PDF文件第5页

相关文件推荐