细胞类型组成的变化在人类健康和疾病中起重要作用。单细胞技术的最新进展使得能够测量细胞类型组成,以增加大量个体的细胞谱系分辨率。这为这些组成数据的统计分析提出了新的挑战,以识别细胞类型频率的变化。我们介绍了Crumblr(Diseeneurogenomics.github.io/crumblr),这是一种可扩展的统计方法,用于使用精确加权的线性混合模型来分析计数比数据,该模型结合了复杂研究设计的随机效应。唯一地,Crumblr使用多元方法在多个级别的细胞谱系层次结构上进行统计测试,以增加对一种单元格测试的功率。在模拟中,与现有方法相比,Crumblr在控制假阳性率的同时增加了功率。我们证明了Crumblr在已发表的单细胞RNA-seq数据集中应用,用于衰老,T细胞中的结核病感染,前列腺癌的骨转移和SARS-COV-2感染。
主要关键词