非稳定的

2024-10-21 机构名称:

OMDP，具有非稳定的战略对手

2020）设置。但是，大多数现有的解决方案都是根据对手遗忘的关键假设建立的，这意味着损失功能的变化不取决于代理的历史轨迹。这个关键的假设限制了无重组算法对许多RL字段的适用性，尤其是多代理增强学习（MARL）（Yang and Wang，2020）。在一个多代理系统中，由于所有代理人都在同时学习，因此一个代理商对其策略的改编将使环境从其他代理商的角度来看。因此，要找到每个玩家的最佳策略，必须考虑他人的战略反应，而不是纯粹是遗忘的。因此，研究非固定算法针对非合理的对手是将现有在线学习技术调整为MARL设置的关键步骤。在线学习中的另一个挑战是系统中的非连面动态。当代理应用无需重格算法（例如乘法更新）（MWU）（Freund and Schapire，1999）或关注正规领导者（FTRL）（Shalev-Shwartz等人），2011年）要互相对抗，该系统展示了庞加莱经常性的行为（Mertikopoulos等人。，2018年），这意味着永远无法实现最后一轮融合（Bailey and Piliouras，2018）。最近的作品（Dinh等人，2021a; Daskalakis和Panageas，

查看详细

File

2011-12-15 机构名称:

大型多元空间数据的协方差近似...

本文研究了多个气候模型误差之间的互相关。我们构建了一个贝叶斯分层模型，该模型解释了各个模型的空间依赖性以及跨不同气候模型的跨构成。我们的方法允许具有不可分割的和非稳定的交叉协方差结构。我们还提出了一种协方差近似方法，以促进非常大的多元空间数据集建模和分析中的计算。协方差近似组成的两个部分：一个减少的秩部分以捕获大规模的空间依赖性，以及稀疏的协方差矩阵，以纠正由降低级别近似所引起的小规模依赖误差。我们特别注意近似值的第二部分具有块对基结构。模型拟合和预测的仿真结果表明，在预测过程近似和独立块分析中，提出的近似值的取代。然后，我们将综合方法应用于多个气候模型错误的联合统计建模。

查看详细

XiaoMi-AI文件搜索系统

非稳定的

OMDP，具有非稳定的战略对手

大型多元空间数据的协方差近似...

按机构统计排名前十媒体

按照发布年份统计数据

XiaoMi-AI