Loading...
机构名称:
¥ 1.0

现在我们知道如何计算纳什均衡了:只需使用遗憾最小化算法对每个玩家运行上述重复博弈,策略的均匀平均值就会收敛到纳什均衡。图 1 展示了课程中迄今为止教授的遗憾最小化算法在通过定理 1 计算零和矩阵博弈的纳什均衡时的性能。性能显示在 3 个随机矩阵博弈类中,其中 A 中的条目根据以下条件进行采样:100×100 均匀 [0, 1]、500×100 标准高斯和 100×100 标准高斯。所有图均在每个设置的 50 个游戏样本中取平均值。我们展示了一个加法算法以供参考:镜像邻近算法,它是一种离线优化算法,以 O 1 的速率收敛到纳什均衡

通过遗憾最小化计算纳什均衡

通过遗憾最小化计算纳什均衡PDF文件第1页

通过遗憾最小化计算纳什均衡PDF文件第2页

通过遗憾最小化计算纳什均衡PDF文件第3页

通过遗憾最小化计算纳什均衡PDF文件第4页

通过遗憾最小化计算纳什均衡PDF文件第5页