跟踪最好的专家私人

我们在动态遗憾的情况下以专家建议为预测的问题设计了不同的私人算法,也被称为跟踪最佳专家。我们的工作介绍了三种自然类型的对手,这些对手,随机分布,遗忘和适应性的变化,以及在所有三个情况下都以次线性后悔的设计算法。特别是,在变化的随机对手下,分布可能会改变SSS时间,我们提供了ε\varepsilonε-划分的私人算法,其预期的动态遗憾最多是O(stlog⁡(nt) +slog⁡(nt) +slog⁡(nt)ε\ weft(\ sqrt(\ sqrt)

来源:Apple机器学习研究