成对比较数据在统计学和机器学习中受到了广泛关注,并在各个领域有着广泛的应用。这类数据通常来自锦标赛,其中每个成对比较结果都来自两个选手或队伍之间的比赛,或来自众包环境,其中个人负责比较两个项目,例如图像、电影或产品。具体而言,著名的瑟斯顿 (Thurstone, 1927) 和布拉德利-特里 (BT; Bradley and Terry, 1952) 模型为该领域奠定了基石,随后进行了许多扩展,包括 Shah 等人 (2016a) 提出的参数序数模型,拓宽了参数模型的类别。Oliveira 等人 (2018) 放宽了已知链接函数的假设,并提出了允许链接函数属于广泛函数家族的模型。非参数方法也已出现,例如 Shah 和 Wainwright (2018) 中基于 Borda 计数算法介绍的工作,以及 Chatterjee (2015) 和 Chatterjee 和 Mukherjee (2019) 研究的非参数 Bradley-Terry 模型。此外,还开发了用于众包环境的成对比较模型,如 Chen 等人 (2013) 和 Chen 等人 (2016) 等所讨论的。成对比较模型已获得广泛的应用,包括排名聚合(Chen and Suh,2015;Chen 等人,2019;Heckel 等人,2019;Chen 等人,2022b)、预测比赛 / 锦标赛(Cattelan 等人,2013;Tsokos 等人,2019;Macr`ı Demartino 等人,2024)、测试博彩市场的效率(McHale and Morton,2011;Ly´ocsa and V`yrost,2018;Ramirez 等人,2023)以及基于人工评估改进大型语言模型(Christiano 等人,2017;Ouyang 等人,2022;Zhu 等人,2023)。虽然上述模型对该领域做出了重大贡献,但它们依赖于随机传递性的假设,这意味着球员/球队/项目之间存在严格的排名。然而,这种假设可能不切实际,特别是在涉及多种技能或策略的环境中,不传递性自然会出现。尽管它具有实际重要性,但对允许不传递性的模型的研究仍然有限。一些值得注意的例外包括 Chen 和 Joachims (2016) 和 Spearing 等人 (2023) 的工作,他们通过引入额外参数来描述不传递性以及基于 Bradley-Terry 概率指定绝对优势的参数,扩展了 Bradley-Terry 模型。Spearing 等人 (2023) 提出了一种在完整贝叶斯框架下进行参数估计的马尔可夫链蒙特卡罗算法。然而,他们的贝叶斯程序计算量大,对于涉及许多球员或相对较高潜在维度的高维设置不切实际。 Chen 和 Joachims (2016) 将参数视为固定量,并通过优化正则化目标函数来估计它们。然而,它们的目标函数是非凸的,并且它们的模型高度过度
主要关键词