详细内容或原文请订阅后点击阅览
反因果域泛化:利用未标记的数据
领域泛化问题涉及学习预测模型,这些模型在部署到以前未见过的新环境中时对分布变化具有鲁棒性。现有方法通常需要来自多个训练环境的标记数据,当标记数据稀缺时限制了它们的适用性。在这项工作中,我们研究反因果环境中的领域泛化,其中结果导致观察到的协变量。在这种结构下,影响协变量的环境扰动不会传播到结果,这会促使模型对……的敏感性进行正则化。
来源:Apple机器学习研究领域泛化问题涉及学习预测模型,这些模型在部署到以前未见过的新环境中时对分布变化具有鲁棒性。现有方法通常需要来自多个训练环境的标记数据,当标记数据稀缺时限制了它们的适用性。在这项工作中,我们研究反因果环境中的领域泛化,其中结果导致观察到的协变量。在这种结构下,影响协变量的环境扰动不会传播到结果,这会促使模型对这些扰动的敏感性进行正则化。至关重要的是,估计这些扰动方向不需要标签,使我们能够利用来自多个环境的未标记数据。我们提出了两种方法,分别惩罚模型对环境中协变量均值和协方差变化的敏感性,并证明这些方法在某些环境类别下具有最坏情况的最优性保证。最后,我们展示了我们的方法在受控物理系统和生理信号数据集上的经验性能。
