预测变量何时知道自己的损失?

给出了一个预测因子和损失函数,我们可以如何预测预测因子在输入上产生的损失?这是损失预测的问题,这是一个与预测变量的不确定性估计相关的关键计算任务。在分类环境中,预测变量通常会预测标签上的分布,因此对预测分布的熵给出了其将造成的损失的估计。我们应该相信这个估计吗?换句话说,预测变量什么时候知道它知道的以及它不知道的知识?在这项工作中,我们研究理论……

来源:Apple机器学习研究

给出了一个预测因子和损失函数,我们可以如何预测预测因子在输入上产生的损失?这是损失预测的问题,这是一个与预测变量的不确定性估计相关的关键计算任务。在分类环境中,预测变量通常会预测标签上的分布,因此对预测分布的熵给出了其将造成的损失的估计。我们应该相信这个估计吗?换句话说,什么时候预测变量知道它知道的知识和不知道的知识?

在这项工作中,我们研究了损失预测的理论基础。我们的主要贡献是在非平凡损失预测与某些形式的多核电之间建立紧密的联系(Hebert-Johnson等,2018),这是一个多组公平的概念,要求跨计算可识别的亚组进行校准的预测。正式地,我们表明,能够在预测变量的自我上提高的损失预测变量会产生多核电失败的见证,反之亦然。这意味着,非平凡损失预测实际上比审核多核算更容易或更难。我们通过实验来支持我们的理论结果,这些实验显示了预测因子的多核误差与训练损失预测指标的疗效之间存在牢固的正相关。