我们对学习算法感兴趣,该算法可在单个卖家面对单个策略性买家的重复情境标价拍卖中优化收益。在我们的设定中,买家最大化其预期累积折现盈余,并且假设他对商品的估价是 ad 维情境(特征)向量的固定函数。我们引入了一种新颖的确定性学习算法,该算法基于二分法的思想,策略遗憾上界为 O(log 2 T)。与之前的研究不同,我们的算法不需要对情境信息的分布做出任何假设,并且遗憾保证适用于任何特征向量的实现(对抗性上界)。为了构建我们的算法,我们非平凡地采用了积分几何技术来对抗买家策略性,并改进了惩罚技巧以在情境拍卖中发挥作用。