详细内容或原文请订阅后点击阅览
学习弹性成本以塑造 Monge 位移
给定一个由 Rd\mathbb{R}^dRd 支持的源和目标概率测量,Monge 问题旨在以最有效的方式将一个分布映射到另一个分布。这种效率通过定义源数据和目标数据之间的成本函数来量化。在机器学习文献中,这种成本通常默认设置为平方欧几里得距离,ℓ22(x,y)=12∥x−y∥22\ell^2_2(x,y)=\tfrac12\|x-y\|_2^2ℓ22(x,y)=21∥x−y∥22。使用弹性成本的好处,通过正则化器 τ\tauτ 定义为 c(x,y)=ℓ22(x,y)+τ(x−y)c(x, y)=\ell^2_2(x,y)+\tau(x-y)c(x,y)=ℓ22(x,y)+τ(x−y),是...
来源:Apple机器学习研究给定一个源和一个基于 Rd\mathbb{R}^dRd 的目标概率测量,Monge 问题旨在以最有效的方式将一个分布映射到另一个分布。这种效率通过定义源数据和目标数据之间的成本函数来量化。在机器学习文献中,这种成本通常默认设置为平方欧几里得距离,ℓ22(x,y)=12∥x−y∥22\ell^2_2(x,y)=\tfrac12\|x-y\|_2^2ℓ22(x,y)=21∥x−y∥22。使用弹性成本的好处,通过正则化器 τ\tauτ 定义为 c(x,y)=ℓ22(x,y)+τ(x−y)c(x, y)=\ell^2_2(x,y)+\tau(x-y)c(x,y)=ℓ22(x,y)+τ(x−y),最近在 (Cuturi et al. 2023) 中被重点介绍。此类成本通过赋予 Monge 映射 TTT 的位移(即源点与其图像 T(x)−xT(x)-xT(x)−x 之间的差异)与 τ\tauτ 的近端算子相匹配的结构,塑造了 Monge 映射的位移。在这项工作中,我们对弹性成本的研究做出了两项重要贡献:(i)对于任何弹性成本,我们提出了一种数值方法来计算可证明最优的 Monge 映射。这提供了一个急需的例程来创建合成问题,其中已知基本事实 OT 图,类似于 Brenier 定理,该定理指出任何凸势的梯度对于 ℓ22\ell_2^2ℓ22 成本始终是有效的 Monge 图;(ii)我们提出一个损失来学习参数化正则化器 τθ\tau_\thetaτθ 的参数 θ\thetaθ,并将其应用于 τA(z)=∥A⊥z∥22\tau_{A}(z)=\|A^\perp z\|^2_2τA(z)=∥A⊥z∥22 的情况。该正则化器促进位于 Rd\mathbb{R}^dRd 的低维子空间上的位移,该子空间由 A∈Rp×dA\in\mathbb{R}^{p\times d}A∈Rp×d 的 ppp 行跨越。我们说明了我们的程序在使用我们的第一个贡献生成的合成数据上的成功,其中我们仅使用样本就展示了 AAA 子空间的近乎完美的恢复。我们通过展示单细胞数据任务的预测改进来证明该方法的适用性。
Rd\mathbb{R}^dRd Rd\mathbb{R}^d