详细内容或原文请订阅后点击阅览
使用最优传输的多元共形预测
保形预测 (CP) 通过构建可信输出集来量化机器学习模型的不确定性。这些集合是通过利用所谓的一致性分数(使用输入兴趣点计算的数量)、预测模型和过去的观察结果来构建的。然后通过评估所有可能输出的一致性分数并根据分数的排名来选择它们来获得CP集。由于这个排名步骤,大多数 CP 方法依赖于单变量的评分函数。将这些分数扩展到多元空间的挑战在于……
来源:Apple机器学习研究保形预测 (CP) 通过构建可信输出集来量化机器学习模型的不确定性。这些集合是通过利用所谓的一致性分数(使用输入兴趣点计算的数量)、预测模型和过去的观察结果来构建的。然后通过评估所有可能输出的一致性分数并根据分数的排名来选择它们来获得CP集。由于这个排名步骤,大多数 CP 方法依赖于单变量的评分函数。将这些分数扩展到多元空间的挑战在于,向量不存在规范顺序。为了解决这个问题,我们利用基于最佳传输(OT)的多变量分数排名的自然扩展。我们的方法 OTCP 提供了一个原则框架,用于在多维设置中构建共形预测集,并使用有限的数据样本保留无分布的覆盖保证。我们在多元回归问题的基准数据集中展示了切实的收益,并解决了通过 OT 地图估计一致性分数时出现的计算和统计权衡问题。
