功能序列的缺失被预测代表了分子进化1,2的基本机制。对第2,3的灵长类动物的比较遗传研究已经确定了数千个人类特异性缺失(HDELS),并且已经使用报告基督分析4。然而,结构变异尺寸(≥50个碱基对)HDEL如何影响其天然基因组环境中的分子和细胞过程。在这里,我们设计了靶向7.2兆布序列序列的基因组尺度库,在6,358个HDELS中的序列,并呈现系统的CRIS PRPR干扰(CRISPRI)筛选方法,以识别HDELS,以识别Chimpanzee Pluripotent Pluripotent干细胞中细胞增殖的HDEL。通过将HDEL与染色质状态特征相交,并执行单细胞CRISPRI(werturb -seq)识别其顺式和反式调节靶基因,我们发现了19个控制基因表达的HDELS。我们重点介绍了两个HDEL_2247和HDEL_585,分别在肝脏和大脑中具有组织特异性活性。我们的发现揭示了在人类谱系中丢失的序列的分子和细胞作用,并为在功能上询问人类特异性遗传变异的框架建立了一个框架。
功能序列的缺失被认为是分子进化的基本机制 1,2 。灵长类动物的比较遗传学研究 2,3 已经发现了数千个人类特异性缺失 (hDels),并且已经使用报告基因检测 4 评估了短 (≤31 个碱基对) hDels 的顺式调控潜力。然而,结构变体大小 (≥50 个碱基对) 的 hDels 如何影响其原生基因组环境中的分子和细胞过程仍未得到探索。在这里,我们设计了针对 6,358 个 hDels 中 7.2 兆碱基序列的单向导 RNA 基因组规模文库,并提出了一种系统的 CRISPR 干扰 (CRISPRi) 筛选方法来识别改变黑猩猩多能干细胞细胞增殖的 hDels。通过将 hDels 与染色质状态特征进行交叉并执行单细胞 CRISPRi(Perturb-seq)来识别它们的顺式和反式调控靶基因,我们发现了 20 个控制基因表达的 hDels。我们重点介绍了两个 hDels,hDel_2247 和 hDel_585,它们在脑中具有组织特异性活性。我们的研究结果揭示了人类谱系中丢失的序列的分子和细胞作用,并建立了一个功能性地询问人类特异性遗传变异的框架。