半离散耦合的流量匹配 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

半离散耦合的流量匹配

2026年3月6日 00:00 33 Comments

参数化为与时间相关的速度场的流动模型可以通过积分 ODE 从噪声生成数据。这些模型通常使用流匹配进行训练，即通过对噪声和目标点 (x0,x1)(\mathbf{x}_0, \mathbf{x}_1)(x0,x1) 的随机对进行采样，并确保沿分段链接评估时速度场平均与 x1−x0\mathbf{x}_1 - \mathbf{x}_0x1−x0 对齐x0\mathbf{x}_0x0 到 x1\mathbf{x}_1x1。虽然默认情况下这些对是独立采样的，但也可以通过将 nnn 噪声批次与 nnn 目标匹配来更仔细地选择它们......

来源:Apple机器学习研究

参数化为与时间相关的速度场的流动模型可以通过积分 ODE 从噪声生成数据。这些模型通常使用流匹配进行训练，即通过对随机的噪声和目标点对 (x0,x1)(\mathbf{x}_0, \mathbf{x}_1)(x0,x1) 进行采样，并确保沿分段链接评估时速度场平均与 x1−x0\mathbf{x}_1 - \mathbf{x}_0x1−x0对齐x0\mathbf{x}_0x0到 x1\mathbf{x}_1x1。虽然默认情况下这些对是独立采样的，但也可以通过使用最佳传输 (OT) 解算器将 nnn 噪声批次与 nnn 目标点进行匹配来更仔细地选择它们。尽管理论上很有前景，但 OT 流量匹配 (OT-FM) 方法在实践中并未得到广泛应用。张等人。 (2025) 最近指出，当批量大小 nnn 显着增长时，OT-FM 才真正开始获得回报，只有 Sinkhorn 算法的多 GPU 实现才能处理这种情况。不幸的是，运行 Sinkhorn 的成本会迅速膨胀，需要对每个用于拟合速度场的 nnn 对进行 O(n2/ε2)O(n^2/\varepsilon^2)O(n2/ε2) 次操作，其中 ε\varepsilonε 是一个正则化参数，通常应该很小才能产生更好的结果。为了实现 OT-FM 的理论承诺，我们建议放弃批量 OT，转而依赖半离散公式，该公式利用了目标数据集分布通常具有有限大小的 NNN 这一事实。 SD-OT问题通过使用SGD估计对偶势向量来解决；使用该向量，可以将训练时新采样的噪声向量与数据点进行匹配，但代价是最大内积搜索 (MIPS)。半离散 FM (SD-FM) 消除了对 n/εn/\varepsilonn/ε 的二次依赖性，该依赖性是 OT-FM 的瓶颈。 SD-FM 在所有训练指标和推理预算约束、跨多个数据集、无条件/条件生成或使用平均流模型时都击败了 FM 和 OT-FM。

** 在 Apple 期间完成的工作

mathbf x0 理论速度场训练指标使用相关的公式预算约束噪声模型完成的 SD 解算器时间相关标数据匹配流动模型参数化 OT x1 数据集数据点 FM nnn 仔细地依赖性向量目标数据才能目标点进行需要参数随机的

半离散耦合的流量匹配

其他外部链接

Tags

XiaoMi-AI