●帮助教授来自全国各地的高级研究生和博士后研究员,以空间转录方法以及空间数据的分析。●举行每日办公时间,以帮助学生熟练精通编程,并了解Scanpy和Seurat软件中不同分析背后的数学和科学。UC圣地亚哥 - BIOM200C-客座讲师2021年2月
先天性心脏病 (CHD) 是造成大量发病率和死亡率的原因,但尽管心脏异常有影响,但其病因仍不太清楚。先前的证据表明遗传机制在 CHD 中发挥作用,最近的数据表明,参与胚胎发育的关键基因 NR2F2 在人类疾病中发挥作用。据推测,NR2F2 是参与心脏发生的分子网络的一部分,对它的研究可以阐明与心脏发育相关的 NR2F2 网络。先前未发表的数据显示,发育中的人类心脏的成纤维细胞和内皮细胞表达 NR2F2 mRNA。基因组编辑模型中的转录组分析使得能够研究基因表达模式和转录因子作为通路和基因组网络的调节剂。我们旨在通过在原代心脏成纤维细胞中敲除 NR2F2 的转录来研究其作用,并通过单细胞 RNA 测序进一步分析随之而来的整体转录组变化。我们从人类胎儿心脏样本中分离出原代迁移细胞,并通过流式细胞术和单细胞 RNA 测序对其进行了鉴定。我们还评估了这些细胞中 NR2F2 转录本和蛋白质的表达,然后针对 CRISPR/Cas9 优化了方案。我们使用核糖核蛋白 (RNP) 系统敲低了成纤维细胞中的 NR2F2,然后在敲低样本和对照样本中进行基于液滴的单细胞 RNA 测序,以比较 NR2F2 缺失引起的扰动。将生物信息学流程应用于类似的公开可用的心脏细胞数据集以进行比较。这些流程包括已知的用于基因表达分析的批量和单细胞 RNA 测序工具,包括 limma 和 Scanpy。因此,我们可以得出结论,人类胎儿成纤维细胞中 NR2F2 活性降低会干扰几种对心脏发生很重要的心脏基因表达,例如 GATA6 和 HEY1,并且还可能影响其他转录因子的活性,例如 NKX2-5,这些转录因子先前与 CHD 表型有关。
单细胞测序技术,包括单细胞RNA测序(SCRNA-SEQ)和单细胞ATAC测序(SCATAC-SEQ),使研究人员能够量化细胞的OMIC PHE-NOTYPES。理想的单细胞数据分析有望帮助研究人员了解细胞上的异质性,提取感兴趣的细胞亚群,识别与细胞亚群相对应的特征基因集,并揭示细胞子源的关系。在这些分析任务中,识别特征基因集是一个关键步骤。特征基因集定义为在细胞亚群之间差异表达的基因集。它们通常用于注释细胞亚群并进行基因集富集分析。现有的特征基因鉴定方法经常采用两步方法(此后称为两步方法):首先将细胞聚集(例如Seurat [1-4],简单的Louvain [5],通过插入性和维度降低(CIDR)(CIDR)[6]和Scanpy [7]和差异表达基因(例如9)(例如9)[8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [8] [14,15],limma-voom [16]和桅杆[17])随后在细胞簇上进行以识别特异性特异性特征基因。但是,这种方法对具有复杂或微妙的异质性的数据具有可疑的精度,因为不准确的初始聚类步骤可能会导致随后的错误特征基因鉴定[18]。但是,这些方法不会将特征基因分离为亚群特异性基因集,从而限制了它们的注释细胞的效用。这些基因集用于计算细胞基因集富集评分,然后注释细胞。另外,某些方法通过检测高度可变基因(HVG)的偏差来识别特征基因,这些基因与人群相对于模型拟合的偏差[19],辍学率[20]和UMI计数分布[21](此后称为HVG方法)。为了克服现有方法的局限性,我们提出了Sifinet,这是一种直接识别特征基因集的独特方法,可消除对先前细胞聚类的需求。源于关键观察,即在细胞亚群中共差异表达的基因也表现出共表达模式(供应。注1),Sifinet构建了一个基因共表达网络,并检查其拓扑以识别特征基因集。此外,这些基因集中的网络意味着细胞亚群之间的关系(图1)。此外,Sifinet可以选择地整合SCATAC-SEQ数据,因为它形成了基因合作 - 染色质网络,并探讨了其拓扑以确定表观基因组特征基因集。Sifinet分析SCRNA-SEQ和SCATAC-SEQ数据的能力使研究人员深入了解了细胞多瘤异质性。我们证明,在识别特征基因集和增强细胞注释精度时,Sifinet优于现有的两步方法和HVG方法。此外,我们认为Sifinet可以鉴定细胞之间的复杂异质性,并揭示细胞亚群中潜在的发育谱系。Sifinet也可以缩放以分析数百万个单元的数据集。我们将Sifinet应用于五个已发表的实验数据集,并发现了一些潜在的新发现,例如潜在的新细胞周期标记和衰老标记,衰老细胞富集的亚群,髓样祖细胞的发育效果以及CD8细胞的发育效果以及CD8细胞的构造以及可能的过渡路径。