耶鲁大学基因组分析中心(YCGA)是最先进的DNA测序中心。这种全服务设施使用各种技术使用最新技术提供微阵列和下一代DNA序列(NGS)分析服务。该中心大约占据7000平方米ft。实验室空间,并具有两个Illumina Novaseqs,一个是Pacbio Sequel II,Element Aviti和Illumina Miseq测序系统。YCGA还使用了四年多的牛津纳米孔单分子技术。使用YCGA的NGS产生了1000多个出版物,其中包括科学,自然和细胞等高影响力期刊中的60多种文章。YCGA在单细胞和空间技术方面具有丰富的经验。我们为基因表达,pip-seq,scatac-seq和Multi-omics的基因表达准备的10x库准备提供了常规服务。我们还使用森林,库里奥,10倍xen,纳米弦COSMX,Atlasxomics空间ATAC-SEQ和MERFISH具有丰富的空间转录组学经验。YCGA提供了许多使用Cut和Tag,Atac-Seq和HIC研究细胞表观遗传方面的服务。我们为这些服务提供技术咨询,图书馆准备,排序和数据分析。
肩突硬蜱,即黑腿蜱,是莱姆病螺旋体伯氏疏螺旋体的主要媒介,是美国每年约 47 万例莱姆病病例中的大多数是由其引起的。肩突硬蜱可以传播另外六种对人类健康有影响的病原体。由于其医学重要性,肩突硬蜱是第一个被测序和注释的蜱基因组。然而,由于节肢动物基因组特有的长重复基因组序列以及缺乏长读长测序技术所带来的技术挑战,第一个组装体肩突硬蜱 Wikel (IscaW) 高度碎片化。尽管由于胚胎注射和 CRISPR-Cas9 介导的基因编辑等新工具的出现,肩胛带蜱已成为蜱研究的模型,但缺乏染色体级支架减缓了蜱生物学的进展和控制工具的开发。在这里,我们结合了多种技术来制作肩胛带蜱 Gulia-Nuss (IscGN) 基因组组装和基因组。我们使用了来自卵和雄性和雌性成年蜱的 DNA,并利用 Hi-C、PacBio HiFi 测序和 Illumina 短读测序技术来制作染色体水平的组装。在这项工作中,我们展示了由 13 条常染色体和性假染色体组成的预测假染色体:X 和 Y,以及与现有组装和注释相比显着改进的基因组注释。
抽象的DNA甲基化在所有生命领域都具有多种功能。在这项研究中,我们研究了三方二烷基卤代联盟中的古细菌甲基团。该联盟包括Haloferax Lucertense SVX82,Halorhabdus sp。svx81,以及一个来自dpann superphylum的纳米尺寸的纳米大小的古scultus svxnc。我们利用PACBIO SMRT和Illumina cDNA测序来分析来自不同组成的甲基甲基组学和转录组学的样品。内源性C TAG甲基化(典型的Haloferax)伴随着甲基化在其他四个基序中,包括GDG C HC甲基化,这是外尾疗特定的。我们对甲基化和未甲基化基序的分布的分析表明,自phat甲基化可能会影响基因调节。Graga A G甲基化的频率在高度表达的基因中增加,而C C TTG和GTCG A GG甲基化可以与限制性修饰(RM)活性有关。一般而言,在该古代的演变过程中,RM活性可能已经降低,以平衡细胞免受入侵者的保护,在压力环境中自限制引起的DNA损伤的减少以及在极端条件下DNA交换的益处。我们的甲基甲基菌群(Cryo-ET)数据表明,我们的甲基甲基分析酶导出了其甲基转移酶,以甲基化Haloferax基因组,揭示了共生体与宿主之间的相互作用的新方面。
使用长读数据获得的高质量基因组不仅可以更好地了解杂合性水平、重复内容以及与使用短读技术获得的基因组相比更准确的基因注释和预测,而且还可以帮助了解单倍型分化。近年来,长读测序技术的进步使得为非模式生物生成此类高质量组装成为可能。这使我们能够重新审视基因组,而使用前几代数据和组装软件将其组装到染色体规模上一直存在问题。线虫是后生动物中种类最多、种类最多的动物门之一,但对其研究仍然很少,许多以前组装的基因组都是碎片化的。使用 Nanopore R10.4.1 和 PacBio HiFi 获得的长读长,我们生成了 Mermithidae 科二倍体线虫的高度连续组装体,目前尚未获得该科的密切相关基因组,以及 Panagrolaimidae 科三倍体线虫的折叠组装体和分阶段组装体。这两个基因组之前都已分析过,但碎片组装体的支架大小与组装前的长读长长度相当。我们的新组装体说明了长读长技术如何更好地表示物种基因组。我们现在能够根据更完整的基因和转座因子预测进行更准确的下游分析。
摘要。在测序相似序列的混合物时,重建单倍型很重要。长阅读测序可以将遥远的等位基因连接到分解类似的单倍型,但是处理误差需要专门的技术。我们提出了Devider,这是一种用于单倍序列(例如病毒或基因)的算法。Devider使用在信息性等位基因的字母表上使用序列到图形对准的位置de bruijn图,以提供与各种长阅读测序技术兼容的快速组装启发的方法。在包含七个HIV菌株的合成纳米孔数据集上,Devider恢复了97%的单倍型内容的97%,即下一个最佳方法的86%,同时服用<4分钟和1 GB的存储器,以> 8000×覆盖范围。基准对抗微生物耐药性(AMR)基因的合成混合物的基准测试表明,分离器恢复了83%的单倍型,比下一个最佳方法高23个百分点。在实际PACBIO和NANOPORE数据集上,Devider在几秒钟内概括了先前已知的结果,从而消除了具有> 10个菌株的细菌群落和HIV-1共感染数据集。我们使用Devider来研究富含AMR基因的长读牛肠元素的宿主内多样性,发现TET(Q)Tetracycline抗性基因具有13种不同的单倍型,具有> 18,000倍覆盖量和6个单倍型的cfxa2 beta-beta-beta-lacta-lacta-lacta-lacta抗体基因。我们发现了这些AMR基因单倍型的清晰重组块,展示了Devider揭示异质混合物生态信号的能力。
进化创新产生了表型和物种多样性。阐明此类创新背后的基因组过程对于理解生物多样性至关重要。在这项研究中,我们探讨了农业害虫玻璃翅神枪手(Homalodisca vitripennis,GWSS)进化新奇性的基因组基础。叶蝉的突出进化创新包括支体,这是一种排出并用于覆盖身体的蛋白质结构,以及与两种细菌类型的强制性共生关系,这两种细菌类型驻留在不同细胞类型的细胞质中。使用 PacBio 长读测序和 Dovetail Omni-C 技术,我们为 GWSS 生成了染色体水平的基因组组装,然后使用流式细胞术和核型分析验证了该组装。额外的转录组学和蛋白质组学数据用于识别支体产生的新基因。我们发现,支体相关基因包括通过串联重复而多样化的新基因家族。我们还确定了与细菌共生体相互作用的基因位置。GWSS 的祖先通过水平基因转移 (HGT) 获得了细菌基因,这些基因似乎有助于共生体支持。使用系统基因组学方法,我们推断了 HGT 的来源和时间。我们发现一些 HGT 事件可以追溯到半翅目 Auchenorrhyncha 亚目共同祖先,代表了动物中已知的一些最古老的 HGT 例子。总体而言,我们表明叶蝉的进化新颖性是通过获得新基因(从头产生和通过串联重复产生)、获得新的共生关联(允许使用新的饮食和生态位)以及招募外来基因来支持共生体和增强食草性而产生的。
我们在这里提出了棕色野兔(Lepus europaeus pallas)的高质量基因组组装,该组件基于来自芬兰东部利珀里(Liperi)的雄性标本的纤维细胞细胞系。这个棕色的野兔基因组代表了芬兰对欧洲参考基因组试验e ort e ort的第一个贡献,以生成欧洲生物多样性的参考基因组。使用HI-C染色体结构捕获方法,使用25倍PACBIO HIFI测序数据组装了基因组,并使用了SCA的旧基因组。在手动策划后,组装的基因组长度为2,930,972,003 bp,N50 sca egs为125.8 MB。93.16%的组装可以分配给25个识别的染色体(23个常染色体加X和Y),与已发布的核型匹配。染色体根据大小编号。基因组基于BUSCO分数(MAM-malia_odb10数据库)具有高度的完整性,完成:96.1%[单副本:93.1%,重复:3.0%],片段为0.8%,缺少2.9%。对细胞系的线粒体基因组进行测序并分别组装。最终注释的基因组具有30,833个基因,其中21,467个多肽代码。棕色野兔基因组特别有趣,因为该物种很容易与北部欧亚大陆物种接触区的山野兔(Lepus timidus L.)杂交,从而产生肥沃的春季,并导致这两个物种之间的基因流。除了为人群研究提供有用的比较外,基因组还可以深入了解一般的毛刺和lagomorpha之间的染色体演化。基因组的染色体组装还表明,细胞系在培养过程中尚未获得核型变化。
中国樱桃(Prunus pseudocerasus)是中国主要的核果作物之一,具有十分重要的意义。然而,由于缺乏高质量的基因组资源,人工改良其性状和遗传分析具有挑战性,这主要归因于难以解析其四倍体和高度杂合的基因组。在此,我们使用 PacBio HiFi、Oxford Nanopore 和 Hi-C 组装了品种‘诸暨短柄饼’的染色体水平、单倍型解析基因组,包含 993.69 Mb,组装成 32 条假染色体。单倍型内比较分析揭示了广泛的基因组内序列和表达一致性。系统发育和比较基因组分析表明,P. pseudocerasus 是一个稳定的同源四倍体物种,与野生的 P. pusilliflora 密切相关,两者大约在 1834 万年前分化。与其他李属植物类似,樱桃也经历了一次常见的全基因组复制事件,该事件发生在大约 1.3996 亿年前。由于果实硬度低,樱桃不适合长距离运输,从而限制了其在中国的快速发展。在成熟果实阶段,樱桃品种‘诸暨短柄梨’的硬度明显低于樱桃品种‘黑珍珠’。硬度的差异归因于果胶、纤维素和半纤维素含量变化的程度。此外,比较转录组分析发现了两个参与果胶生物合成的基因 GalAK-like 和 Stv1,这可能是造成‘诸暨短柄梨’和‘黑珍珠’果实硬度差异的原因。PpsGalAK-like 和 PpsStv1 的瞬时转化会增加原果胶含量,从而提高果实硬度。我们的研究为中国樱桃功能基因组学研究和重要园艺性状的提升奠定了坚实的基础。
杨梅 (Myrica rubra 或 Morella rubra;2n = 16) 所产果实风味独特、营养丰富、经济价值高。然而,先前版本的杨梅基因组缺乏序列连续性。此外,迄今为止,尚无大规模种质资源关联分析检查过决定果实品质性状的等位基因和遗传变异。因此,在本研究中,我们使用 PacBio HiFi 长读长为品种‘早嘉’组装了一个端粒到端粒 (T2T) 无间隙参考基因组。得到的 292.60 Mb T2T 基因组揭示了 8 个着丝粒区域、15 个端粒和 28 345 个基因。这代表着杨梅基因组的连续性和完整性的显著提高。随后,我们对 173 个种质进行了重新测序,鉴定出 6 649 674 个单核苷酸多态性 (SNP)。此外,29 个果实品质相关性状的表型分析促成了全基因组关联研究 (GWAS),该研究鉴定了与 28 种性状显著相关的 1937 个 SNP 和 1039 个基因。在 Chr6:3407532 至 5 153 151 bp 区域上鉴定了一个与果实颜色相关的 SNP 簇,包含两个 MYB 基因(MrChr6G07650 和 MrChr6G07660),这些基因在极端表型转录组中表现出差异表达,与花青素合成有关。一个相邻的、紧密连锁的基因 MrChr6G07670(MLP 样蛋白)包含一个外显子错义变体,经证实可使烟草叶片中的花青素产量增加十倍。这个 SNP 簇可能是一个数量性状基因座 (QTL),它共同调控杨梅果实的颜色。总之,我们的研究提出了一个完整的参考基因组,揭示了一系列与果实品质性状相关的等位基因变异,并确定了可以利用来提高杨梅果实品质和育种效率的功能基因。
为了保留其品种属性,已建立的葡萄品种(Vitis vinifera L. ssp. vinifera)必须进行克隆繁殖,因为它们的基因组是高度杂合的。马尔贝克是一种源自法国的品种,因生产高品质的葡萄酒而受到赞赏,是品种 Prunelard 和 Magdeleine Noire des Charentes 的后代。在这里,我们将 PacBio 长读段三重合并到从父母遗传的两个单倍体补体中,构建了马尔贝克的二倍体基因组组装。经过单倍型感知的重复数据删除和校正后,获得了两个单倍相的完整组装,且单倍型转换错误率非常低(< 0.025)。单倍相比对确定了 > 25% 的多态性区域。基因注释(包括 RNA-seq 转录组组装和从头算预测证据)导致两个单倍相的基因模型数量相似。利用注释的二倍体组装体对四个表现出浆果组成特征差异的马尔贝克克隆种质进行转录组比较。使用任一单倍体作为参考对成熟果皮转录组进行分析,得到了相似的结果,尽管观察到了一些差异。特别是,在仅以 Magdeleine 遗传单倍型为参考鉴定的差异表达基因中,我们观察到假设的半合子基因的过度表达。克隆种质 595 的浆果花青素含量较高,与脱落酸反应增加有关,可能导致观察到的苯丙烷代谢基因的过度表达和与非生物应激反应相关的基因的失调。总体而言,结果强调了生产二倍体组装体的重要性,以充分代表高度杂合的木本作物品种的基因组多样性并揭示克隆表型变异的分子基础。