摘要解释非编码GWAS变体的功能意义仍然具有挑战性。虽然与细胞类型的特定顺式调节元件(CRE)共定位变体促进了我们的理解,但许多变体仍然无关。在这项研究中,我们提出了Gem-Finder(用于精细发现启动子链接变体的基因组元素映射),这是一个新型的分析框架,该框架整合了转录组,表观基因组(H3K27AC CHIP-SEQ)和染色质相互作用数据。Gem-Finder利用远程染色质相互作用来识别连接特定细胞类型的差异表达基因的CR。当我们将宝石 - 芬德用于内皮分化时,与主要针对细胞类型特异性CRE的常规方法不同,Gem-Finder识别出7.6倍的疾病/性状关联。具体而言,通过整合转录组,表观基因组(尤其是H3K27AC CHIP-SEQ)和内皮分化过程中的远程染色质相互作用,我们确定了与分化特异性基因相关的CRE。我们的丰富分析揭示了53种人类疾病/特征的共同和独特的关联。值得注意的是,其中大多数(68%)以特定于分化的方式表现出独特的关联。血液学特征和神经精神疾病主要与内皮分化的最后阶段有关,而几种复杂的疾病(例如结直肠癌(CRC))与后期意外相关。我们的发现强调了利用远程染色质相互作用以准确识别与疾病相关的CRE在非编码GWAS变体的功能表征中的重要性。
抽象密钥消息提出了一个原始的GWAS模型,该模型集成了等位基因的祖先,并允许探测背景特定的添加剂和优势QTL,涉及异性群互补性和混合性能。抽象的玉米遗传多样性被构造成彼此选择和改善的遗传群体。此过程会随着时间的流逝而增加组的互补性和分化,并确保由小组间杂交产生的杂种表现出较高的表现和异性症。为了确定与混合性能和杂种群体互补涉及的基因座,我们引入了一个原始的关联研究模型,该模型将等位基因的异性群的起源与异性构成群体分离,并将其与常规的添加剂/优势模型进行了比较。这个新模型应用于凹痕和弗林特线之间的阶乘,以及具有两种不同分析层的凹痕混合线之间的拨号线:在每个环境中和多种环境中。我们确定了所有特征的几个强大的添加剂QTL,包括一些用于开花时间的众所周知的加性QTL(在染色体8上的VGT1/2区域)。屈服特征在拨号面板中显示出显着的非加性效果。大多数检测到的产量QTL表现出过度势力或更有可能的伪过分效应。在这些QTL上明显过度污染,导致了遗传组互补性的一部分。环境之间的比较显示,添加QTL效应的稳定性高于非添加效应。我们还揭示了显示遗传群起源作用的大型染色体区域。根据局部杂种群的起源,几个QTL显示出效应的变化。总的来说,我们的结果说明了混合面板如何与专用的GWAS建模相结合,允许识别新的QTL,这些QTL无法通过通过传统建模分析的经典混合面板无法揭示的新QTL。
罕见的疾病由于其多种症状而经常出现微妙的症状以及其低患病率而引起了重大诊断挑战。基因组广泛的关联研究(GWAS)已经鉴定出遗传变异和疾病之间的关联,但是指出因果基因,特别是在单基因稀有疾病中,仍然很复杂。该项目利用大语言模型的力量来增强GWAS分析并改善罕见疾病的诊断。我们的方法探讨了两个关键目的:(1)给定一组通过GWAS鉴定的顶级病原基因候选者,预测与这些基因相关的可能条件,考虑它们的复杂相互作用和潜在的多源性效应,以及(2)开发LLM驱动的型框架,以使年龄较大的疾病,详细症状,临床诊断,临床诊断,临床上的疾病,概述了较高的诊断,以诊断为包括年龄的患者特征,并最大程度地诊断出临床,并诊断出临床,并诊断出临床,并诊断出临床,该临床的诊断。这种方法旨在提高诊断准确性,并减少罕见病患者诊断的时间。我们将使用已发表的稀有疾病案例研究来验证我们的模型,并将我们的性能与现有诊断方法进行比较。
在GWAS基因座附近发现的从头变体的功能注释,有或没有left裂的嘴唇sarah W. Curtis 1,Laura E. Cook 3,Kitt Paraiso 3,Kitt Paraiso 3,Axel Visel 2,3,Axin L. Cotney 4,Justne L. Cotney 4,Justney 5 J. Leslie-Clarkson 1 * 1-人类遗传学系,埃默里大学医学院,亚特兰大,佐治亚州亚特兰大,30322 2-美国能源部联合基因组研究所,劳伦斯·伯克利国家实验室,加利福尼亚州伯克利,加利福尼亚州伯克利,3-环境基因组和系统生物学部,加利福尼亚州伯克利,加利福尼亚州伯克利。4- - 费城儿童医院,宾夕法尼亚州费城儿童医院研究所,19104年5月5日 - 爱荷华州爱荷华大学儿科学系,爱荷华州,爱荷华州,52242 6-流行病学系,约翰·霍普金斯·布卢姆伯格公共卫生部,巴尔蒂群岛,哥伦比亚省,约翰斯·霍普金斯·布卢姆伯格(Johns Hopkins Bloomberg)宾夕法尼亚州匹兹堡匹兹堡大学生物学,15261 8-匹兹堡大学人类遗传学系,宾夕法尼亚州匹兹堡,匹兹堡,15621 9-匹兹堡生物统计学和健康数据科学系,匹兹堡,匹兹堡,匹兹堡,宾夕法尼亚大学,15261年,宾夕法尼亚大学15261年。颅面出生缺陷,影响700分的分娩,有强大的遗传基础,家庭内部复发风险很高。 因此,我们从1,409个三重点重新分析了现有的DNV数据集,其OFC经过了已知的OFC相关基因座的靶向测序。 然后,我们通过在人类颅面发育过程中从预测的表观遗传功能数据集中提供了这些DNV的注释。- 费城儿童医院,宾夕法尼亚州费城儿童医院研究所,19104年5月5日 - 爱荷华州爱荷华大学儿科学系,爱荷华州,爱荷华州,52242 6-流行病学系,约翰·霍普金斯·布卢姆伯格公共卫生部,巴尔蒂群岛,哥伦比亚省,约翰斯·霍普金斯·布卢姆伯格(Johns Hopkins Bloomberg)宾夕法尼亚州匹兹堡匹兹堡大学生物学,15261 8-匹兹堡大学人类遗传学系,宾夕法尼亚州匹兹堡,匹兹堡,15621 9-匹兹堡生物统计学和健康数据科学系,匹兹堡,匹兹堡,匹兹堡,宾夕法尼亚大学,15261年,宾夕法尼亚大学15261年。颅面出生缺陷,影响700分的分娩,有强大的遗传基础,家庭内部复发风险很高。因此,我们从1,409个三重点重新分析了现有的DNV数据集,其OFC经过了已知的OFC相关基因座的靶向测序。然后,我们通过在人类颅面发育过程中从预测的表观遗传功能数据集中提供了这些DNV的注释。尽管以前的许多研究都将常见的,非编码的遗传基因座与OFC相关联,但在OFC案例中,先前对从头变异的研究(DNV)的研究重点是编码可能对蛋白质结构产生功能影响的变体,并且对非编码DNV对OFC形成的贡献也没有被忽略,并且已被忽略了。在预测的增强子或启动子区域内。两个DNV落在相同的增强子区域(HS1617)之内,这超出了偶然性的预期(p = 0.0017)。预计由这些DNV引起的序列变化将创建在转录因子PAX6和ZBTB7A的参考序列中未见的结合位点,并破坏了STAT1和STAT3的结合位点。该增强子区域与HHAT,SERTAD4和IRF6在同一拓扑相关的域内,所有这些区域都参与颅面发育。这三个基因在人神经rest细胞中高度表达。HHAT和IRF6的基因敲除小鼠具有异常的胚胎发育,包括left裂,IRF6及其周围的变体与人类OFC的非综合症和综合综合症形式有关。综上所述,这表明非编码DNV有助于OFC的遗传结构,在增强子区域中,OFC Trios的DNV负担在已知的OFC相关基因附近。总的来说,这增加了我们对OFC形成基础的遗传机制的理解。
通讯作者:Jian Wang,医学博士,博士,呼吸道疾病的州主要实验室,广州呼吸健康研究所,广州医科大学的第一家附属医院,Yanjiang Road,151 Yanjiang Road,Guangzhou,Guangdong,Guangdong,510120,人民共和国人民共和国;电话。:86-20-83205097;传真:86-20-83205074;电子邮件:jianwang@gzhmu.edu.cn; OrcID:0000-0002-1278-256X。Yuqin Chen,医学博士,博士,国家关键疾病国家关键实验室,国家呼吸医学中心,国家临床研究中心,广州呼吸道健康研究所,呼吸道健康研究所,广州医学院第一家附属医院,151 Yanjiang Road,Yanjiang Road,Guangzhou,Guangzhou,Guangangdong,510120年,Yanjiang Road,151电话。:86-20-83205008;传真:86-20-83205074;电子邮件:yqchen@gzhmu.edu.cn; OrcID:0000-0002-7011-7250。张张,张,博士,国家关键呼吸道疾病的主要实验室,国家呼吸医学中心,国家呼吸道疾病临床研究中心,广州呼吸道健康研究所,广州医科大学第一家隶属医院,151 Yanjiang Road,Guangzhou,Guangzhou,Guangangdong,510120120120120年,Yanjiang Road,151电话。:86-20-83205008;传真:86-20-83205074;电子邮件:vidsing65@126.com; OrcID:0009-0003-3067-1075。
全基因组关联研究 (GWAS) 可以揭示重要的基因型-表型关联,但是,必须解决数据质量和可解释性问题。对于寻求根据现有证据确定目标优先次序的药物发现科学家来说,这些问题超出了单个研究的范围。在这里,我们描述了推断的基因-性状关联的合理排名、过滤和解释,以及通过利用现有的管理和协调工作跨研究的数据聚合。对每个基因-性状关联进行置信度评估,分数完全来自汇总统计数据,将蛋白质编码基因和表型联系起来。我们提出了一种从跨研究汇总证据评估基因-性状关联置信度的方法,包括基于 iCite 相对引用率和平均排名分数对科学共识进行文献计量评估,以汇总多元证据。该方法旨在用于药物靶点假设的生成、评分和排序,已作为分析流程实施,以开源形式提供,具有公共结果数据集和专为药物研发科学家使用而设计的 Web 应用程序,网址为 https://unmtid-shinyapps.net/tiga/。
1丹麦弗雷德里克斯伯格哥本哈根大学地球科学与自然资源管理系| 2西北德国森林研究所,汉恩。Münden,德国| 3立陶宛考纳斯的Kaunas林业与环境工程大学应用科学大学| 4 NTNU大学博物馆自然历史系,挪威科学技术大学(NTNU),挪威特朗德海姆| 5立陶宛立陶宛农业与林业研究中心,立陶宛Kaunas | 6 Zentralstelle der forstverwaltung,ForschungsanstaltfürWaldökologieund forstwirtschaft,Hauptstraße16,Trippstadt,德国| 7森林生物多样性与自然保护研究所,联邦森林研究与培训中心,自然危害和景观,奥地利维也纳| 8 Skogforsk,Ekebo 2250,Svalöv,瑞典| 9瑞典农业科学大学瑞典南部森林研究中心,瑞典阿尔纳普| 10森林发展部,爱尔兰都柏林Teagasc | 11巴伐利亚森林遗传学办公室(AWG),德国Teisendorf | 12森林昆虫学研究所,森林病理学和森林保护,生态系统管理部,气候与生物多样性,波库大学,维也纳,奥地利,奥地利| 13丹麦哥本哈根卫生与医学科学学院进化全息学中心| 14 BIOGECO,INRAE,波尔多大学,法国CESTASMünden,德国| 3立陶宛考纳斯的Kaunas林业与环境工程大学应用科学大学| 4 NTNU大学博物馆自然历史系,挪威科学技术大学(NTNU),挪威特朗德海姆| 5立陶宛立陶宛农业与林业研究中心,立陶宛Kaunas | 6 Zentralstelle der forstverwaltung,ForschungsanstaltfürWaldökologieund forstwirtschaft,Hauptstraße16,Trippstadt,德国| 7森林生物多样性与自然保护研究所,联邦森林研究与培训中心,自然危害和景观,奥地利维也纳| 8 Skogforsk,Ekebo 2250,Svalöv,瑞典| 9瑞典农业科学大学瑞典南部森林研究中心,瑞典阿尔纳普| 10森林发展部,爱尔兰都柏林Teagasc | 11巴伐利亚森林遗传学办公室(AWG),德国Teisendorf | 12森林昆虫学研究所,森林病理学和森林保护,生态系统管理部,气候与生物多样性,波库大学,维也纳,奥地利,奥地利| 13丹麦哥本哈根卫生与医学科学学院进化全息学中心| 14 BIOGECO,INRAE,波尔多大学,法国CESTAS
。cc-by-nc-nd 4.0国际许可证(未经同行评审证明)获得的是作者/资助者,他授予Biorxiv授予Biorxiv的许可,以永久显示预印本。这是此预印本版本的版权持有人,该版本发布于12月29日,2024年。 https://doi.org/10.1101/2024.03.19.585778 doi:Biorxiv Preprint
Faba Bean(Vicia Faba L.)是在全球各种气候下种植的豆科植物。它具有增加种植的高潜力,可以满足人类饮食中更多基于植物的蛋白质的需求,这是更可持续的食品生产系统的先决条件。对农作物多样性面板的表征可以确定植物育种目标特征的变化和遗传标记。在这项工作中,我们收集了来自世界各地的220种Faba Bean的多样性面板,这些面板由基因库材料和市售品种组成。这项研究的目的是量化目标性状的表型多样性,以分析育种对这些特征的影响,并通过全基因组关联研究(GWAS)鉴定与性状相关的遗传标记。在两年内在北欧纬度的领域条件下进行表征,发现对11种农艺和种子质量特征有很大的基因型变异和高宽义的遗传力。成对的相关性表明,种子产量与植物高度,每植物的种子数量以及成熟天数正相关。此外,对于早期的流量饰品和较大种子的加入,对豆象鼻损伤的敏感性显着较高。在这项研究中,没有发现较高的种子蛋白质含量的屈服罚款,但是蛋白质含量与淀粉含量有负相关。我们的结果表明,尽管Faba豆质种质的繁殖进展导致每植物的产量和种子数量增加,但它们也导致了延迟浮躁和成熟发作的选择压力。三个DARTSEQ基因分型鉴定6,606个单核苷酸多态性(SNP),通过对齐Faba Bean参考基因组。这些SNP用于GWAS,揭示了51个与十个评估性状相关的新型SNP标记。
植物再生是植物繁殖的一个重要方面,也是转基因植物生产的关键步骤。然而,不同基因型和物种的再生能力差异很大,其分子基础在很大程度上是未知的。全基因组关联研究 (GWAS) 等关联作图方法早已证明能够帮助揭示植物性状变异的遗传基础;然而,这些方法的性能取决于表型分析的准确性和规模。为了对模型树杨树的植物愈伤组织和芽再生进行大规模 GWAS,我们开发了一个涉及语义分割的表型组学工作流程,以量化再生植物组织随时间的改变。我们发现得到的统计数据高度非正态分布,因此采用了变换或排列以避免违反 GWAS 中使用的线性模型的假设。我们报告了超过200个统计学上支持的数量性状基因位点(QTL),其中基因包含或接近顶级QTL,包括细胞粘附、应激信号和激素信号通路的调控因子,以及其他多种功能。我们的研究结果鼓励植物再生过程中激素信号转导模型除了通常考虑的生长素和细胞分裂素途径外,还应考虑应激相关信号(例如涉及茉莉酸和水杨酸)的关键作用。我们鉴定的假定调控基因和生物学过程为理解植物再生的生物学复杂性提供了新的见解,并可能成为改善顽固基因型和物种再生和转化的新方法。