最近的生物技术进步导致了越来越多的单细胞研究,这揭示了对大量扰动的分子和表型反应。但是,跨不同数据集的分析通常会受到格式,命名惯例,数据过滤和归一化的差异的阻碍。为了促进系统生物学中计算方法的开发和基准测试,我们收集了一组具有分子读数的44个公开可用的单细胞扰动 - 响应数据集,包括转录组学,蛋白质组学和表观基因组学。我们采用统一的预处理和质量控制管道并协调特征注释。最终的信息资源可以有效地开发和测试计算分析方法,并促进了整个数据集的直接比较和集成。使用这些数据集,我们演示了电子距离的应用,以量化扰动相似性和强度。这项工作为研究人员提供了一种信息资源和指南,并指导了使用单细胞扰动数据,并突出了新实验的概念注意事项。数据收集,Scperturb,可在scperturb.org上公开获得。
主要关键词