使用 Moscot 映射时间和空间中的细胞

单细胞基因组学技术能够在时间和空间维度上对数百万个细胞进行多模态分析。实验限制阻碍了在其原生时间动态或空间组织环境中测量包罗万象的细胞状态。最佳传输理论已成为克服此类限制的有力工具,能够恢复原始细胞环境。然而,目前大多数可用的算法实现都没有跟上数据集复杂性不断增加的步伐,因此当前的方法无法结合多模式……

来源:Apple机器学习研究

单细胞基因组学技术能够跨时间和空间维度对数百万个细胞进行多模态分析。实验限制阻碍了测量细胞在其原生时间动态或空间组织环境中的全方位细胞状态。最佳传输理论已成为克服此类限制的有力工具,能够恢复原始细胞环境。然而,目前可用的大多数算法实现都无法跟上数据集复杂性的增加,因此当前方法无法整合多模态信息或扩展到单细胞图谱。在这里,我们介绍了多组学单细胞最佳传输 (moscot),这是一个通用且可扩展的单细胞基因组学最佳传输应用框架,支持所有应用中的多模态性。我们展示了 moscot 能够有效重建 20 个时间点的 170 万个小鼠胚胎细胞的发育轨迹,并识别第一个心脏场形成的驱动基因。 moscot 公式还可用于跨空间维度传输细胞:为了证明这一点,我们通过映射小鼠肝脏样本中单细胞图谱的多模态信息来丰富空间转录组学数据集,并对齐小鼠大脑的多个冠状切片。然后,我们介绍了 moscot.spatiotemporal,这是一种利用跨空间和时间维度的基因表达来揭示小鼠胚胎发生的时空动态的新方法。最后,我们使用基因表达和染色质可及性的配对测量来解开一种新型小鼠时间分辨胰腺发育数据集中的谱系关系,找到 delta 细胞和 epsilon 细胞之间共同祖先的证据。Moscot 是一个易于使用的开源 Python 包,其中包含大量文档。

这里 慕尼黑亥姆霍兹大学 慕尼黑工业大学 (TUM) 苏黎世联邦理工学院 耶路撒冷希伯来大学