GENOT:熵 (Gromov) Wasserstein 流匹配及其在单细胞基因组学中的应用

单细胞基因组学极大地促进了我们对细胞行为的理解,促进了治疗和精准医疗的创新。然而,单细胞测序技术本质上具有破坏性,只能同时测量有限的数据模式。这一限制凸显了对能够重新排列细胞的新方法的需求。最佳传输 (OT) 已成为一种有效的解决方案,但传统的离散求解器受到可扩展性、隐私和样本外估计问题的阻碍。这些挑战刺激了神经网络的发展……

来源:Apple机器学习研究

单细胞基因组学极大地促进了我们对细胞行为的理解,促进了治疗和精准医疗的创新。然而,单细胞测序技术本质上具有破坏性,只能同时测量有限的数据模式。这一限制凸显了对能够重新排列细胞的新方法的需求。最佳传输 (OT) 已成为一种有效的解决方案,但传统的离散求解器受到可扩展性、隐私和样本外估计问题的阻碍。这些挑战促使开发基于神经网络的求解器(称为神经 OT 求解器),该求解器参数化 OT 图。然而,这些模型通常缺乏更广泛的生命科学应用所需的灵活性。为了解决这些不足之处,我们的方法学习随机图(即传输计划),允许任何成本函数,放宽质量守恒约束并集成二次求解器来应对(融合)Gromov-Wasserstein 问题带来的复杂挑战。我们的方法利用流匹配作为主干,提供了一个灵活而有效的框架。我们通过细胞发育研究、细胞药物反应建模和跨模态细胞翻译中的应用证明了其多功能性和稳健性,表明其在增强治疗策略方面具有巨大潜力。