从成对偏好中学习：Bradley Terry 模型简介 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

从成对偏好中学习：Bradley Terry 模型简介

2026年5月27日 15:00 33 Comments

如何将简单的面对面选择转化为概率排名这篇文章《从成对偏好中学习：布拉德利·特里模型简介》首先出现在《走向数据科学》上。

来源:走向数据科学

假定绝对标签可用。例如，一个实例属于一个类，一个文档收到一个分数，一个观察被分配一个概率，一个产品按照固定的等级进行评级。然而，在实践中，人类的判断往往以更局部和比较的形式出现。人们可能不知道某个答案是否值得 7.4 分（满分 10 分），但他们通常可以说出两个答案中哪一个更好。他们可能会犹豫是否要给候选人打绝对质量分数，但他们可以说两个候选人中哪一个看起来更强。在许多实际系统中，比较比校准容易得多。

在这种情况下，Bradley-Terry 模型变得特别有用，因为它提供了一种数学上干净的方法来学习成对偏好。它不要求绝对的判断，而是从简单的面对面结果开始，并使用它们来推断项目的潜在排序，以给出连贯的概率排名。

核心理念：每个项目都有潜在的优势

该模型从一个简单的假设开始。每个项目 i 都与一个未观察到的正强度参数相关联，记作 πᵢ > 0。当项目 i 与项目 j 进行比较时，i 优于 j 的概率定义为：

并且，对称地我们可以写：

这种形式非常有吸引力，因为它既简单又易于解释。如果两个项目的强度相同，则每个项目获胜的概率为 1/2。如果 πᵢ 远大于 πⱼ，那么 i 获胜的可能性就更大。 Bradley Tery 模型将隐藏的相对优势转化为可观察的成对概率。

编写相同模型的第二种通常更方便的方法是将每个正强度表示为实值分数的指数：

将其代入概率表达式，得到：

也可以写成：

更具体地说，重要的不是某个项目得分的绝对水平，而是它在比较中相对于其他项目的位置。

一个简单的示例

A 优于 B

A 优于 C

可识别性

或

方便的固定的可识别性优于答案候选人是否模型质量例如形式绝对观察的一个 Bradley 绝对的面对面表达式相关联实际系统重要的观察到的比较的分数的分数可能性潜在的可观察的强度项目模型的吸引力可能判断隐藏的每个连贯的简单的干净的概率