1医学和人口遗传学计划,麻省理工学院和哈佛大学,马萨诸塞州剑桥市,美国马萨诸塞州剑桥市2142,美国2史丹利中心,麻省理工学院和哈佛大学,马萨诸塞州剑桥大学,美国马萨诸塞州剑桥市,美国3号,美国3号遗传学部,哈佛大学 02130, United States 5 Booz Allen Hamilton Inc, McLean, VA 22102, United States 6 Department of Psychiatry and Behavioral Sciences, SUNY Downstate Health Sciences University, Brooklyn, NY 11203, United States 7 Institute for Genomics in Health, SUNY Downstate Health Sciences University, Brooklyn, NY 11203, United States 8 Cooperative Studies Program, VA New York Harbor Healthcare System,布鲁克林,纽约州11209,美国和9号精神病学系,罗伯特·伍德·约翰逊医学院,新不伦瑞克省,新泽西州08901,美国 *通讯作者。斯坦利中心,麻省理工学院和哈佛大学,剑桥,马萨诸塞州02142,美国。电子邮件:giulio.genovese@gmail.com副编辑:Christina Kendziorski电子邮件:giulio.genovese@gmail.com副编辑:Christina Kendziorski
Chromosome-scale genome assembly of bread wheat's wild relative Triticum timopheevii 1 2 Surbhi Grewal 1 , Cai-yun Yang 1 , Duncan Scholefield 1 , Stephen Ashling 1 , Sreya Ghosh 2 , David 3 Swarbreck 2 , Joanna Collins 3 , Eric Yao 4,5 , Taner Z. Sen 4,5 , Michael Wilson 6 , Levi Yant 6 , Ian P. King 1和4 Julie King 1 5 6 1。麦片研究中心,植物与作物科学系,生物科学学院,诺丁汉大学7号大学,拉夫堡,LE12 5rd,英国8 2。伯爵研究所,诺里奇研究公园,诺里奇NR4 7UZ,英国9 3。基因组参考信息学团队,惠康桑格学院,惠康信托基因组10校园,欣克斯顿,CB10 1RQ,英国11 4。加利福尼亚大学加利福尼亚大学,加利福尼亚州伯克利生物工程系,美国94720,美国12 5。 美国农业部 - 农业研究服务局,西部地区13研究中心,农作物改善与遗传学研究部门,布坎南街800 诺丁汉大学,大学公园,诺丁汉,NG7 2rd 16通讯作者:Surbhi Grewal(surbhi.grewal@nottingham.ac.uk)17 18摘要19 20 20小麦(Triticum aestivum)是最重要的食物作物之一,迫切需要增加生产的生产,以养活生长的世界。 triticum timopheevii(2n = 4x = 28)是一种同种二磷酸22小麦野生物种,其中包含在许多23个先前的小麦改善育种计划中利用的A T和G基因组。 在这项研究中,我们报告了基于PACBIO 25 HIFI读取和染色体构象捕获(HI-C)的24个染色体尺度参考基因组组装PI 94760。 ex asch。加利福尼亚大学加利福尼亚大学,加利福尼亚州伯克利生物工程系,美国94720,美国12 5。美国农业部 - 农业研究服务局,西部地区13研究中心,农作物改善与遗传学研究部门,布坎南街800诺丁汉大学,大学公园,诺丁汉,NG7 2rd 16通讯作者:Surbhi Grewal(surbhi.grewal@nottingham.ac.uk)17 18摘要19 20 20小麦(Triticum aestivum)是最重要的食物作物之一,迫切需要增加生产的生产,以养活生长的世界。 triticum timopheevii(2n = 4x = 28)是一种同种二磷酸22小麦野生物种,其中包含在许多23个先前的小麦改善育种计划中利用的A T和G基因组。 在这项研究中,我们报告了基于PACBIO 25 HIFI读取和染色体构象捕获(HI-C)的24个染色体尺度参考基因组组装PI 94760。 ex asch。诺丁汉大学,大学公园,诺丁汉,NG7 2rd 16通讯作者:Surbhi Grewal(surbhi.grewal@nottingham.ac.uk)17 18摘要19 20 20小麦(Triticum aestivum)是最重要的食物作物之一,迫切需要增加生产的生产,以养活生长的世界。triticum timopheevii(2n = 4x = 28)是一种同种二磷酸22小麦野生物种,其中包含在许多23个先前的小麦改善育种计划中利用的A T和G基因组。在这项研究中,我们报告了基于PACBIO 25 HIFI读取和染色体构象捕获(HI-C)的24个染色体尺度参考基因组组装PI 94760。ex asch。组件的总尺寸为26 9.35 GB,具有42.4 Mb的重叠元素N50和166,325个预测的基因模型。DNA甲基化27分析表明,G基因组的平均甲基化碱基比A T基因组更多。28 g基因组也与aegilops speltoides的S基因组更紧密相关,而不是与六倍体或四倍体小麦的B 29基因组。总而言之,T。timopheevii基因组组装为30发现了对食品31安全性的农艺重要基因的基因组发现的宝贵资源。32 33背景和摘要34 35人物属包括许多野生和栽培的小麦种类,包括二倍体,四倍体36和六倍体形式。多倍体物种起源于甲状腺素和37个相邻的Aegilops属(山羊草)之间的杂交。四倍体物种,毛triticum triticum tricum torgidum(2n = 4x = 28,38 aabb),也称为emmer小麦,三质体timopheevii(2n = 4x = 4x = 28,a t a t gg)是39多态的。triticum urartu thum。ex gandil(2n = 2x = 14,aa)是这两个物种1的基因组供体1,而B和G基因组与Aegilops 41 Speltoides 2的S基因组密切相关。两种四倍体物种均具有野生和驯化的形式,即T. turgidum L. ssp。42 dicoccoides(Körn。&graebn。)Thell。和SSP。dicoccum(schrankexschübl。)thell。,分别为43,T。Timopheevii(Zhuk。)Zhuk。 ssp。 armeniacum(jakubz。) slageren和ssp。 分别为44 timopheevii。 durum(desf。) 45 HUSN。Zhuk。ssp。armeniacum(jakubz。)slageren和ssp。分别为44 timopheevii。durum(desf。)45 HUSN。45 HUSN。此外,四倍体硬质小麦T. turgidum L. ssp。(2n = 4x = 28,AABB),用于意大利面的生产,六倍层面包小麦triticum aestivum aestivum 46 L.(2n = 6x = 42,aabbdd)从驯养的emmer小麦中进化而成,后者与aegilops tauschii(d tauschii donore hybridations the the the the the bentertiationally the tauschii donore(d genuschii donor)(d donore)6,000,000,000,000,000,000。十六世纪48个Triticum Zhukovskyi(Aagga M a M)源自培养的Timopheevii杂交和49个培养的Einkorn triticum单球菌3(2n = 2x = 2x = 14,A M A M)。50 51
Lamiaceae家族的成员Baicalaria Baicalensis Georgi是一家广泛使用的药用植物。从黄葡萄球菌中提取的黄酮促成了许多健康益处,包括抗炎,抗病毒和抗肿瘤活性。但是,不完全的基因组组装阻碍了对黄链树的生物学研究。这项研究通过PACBIO HIFI,纳米孔超长和HI-C技术的整合,提出了第一台端粒到核(T2T)间隙 - 无链球菌的基因组组装。获得了384.59 MB的基因组大小,其重叠群N50为42.44 MB,所有序列均固定在没有任何间隙或不匹配的9个假色体中。此外,我们使用广泛靶向的代谢组方法分析了与蓝紫花花的测定有关的主要氰化素和delphinidin的花青素。基于整个基因组的鉴定(CYP450)基因家族,三个基因(SBFBH1、2和5)编码类黄酮3'-羟基酶(F3'HS)(F3'HS)和一个基因(SBFBH7)(SBFBH7)(SBFBH7)(SBFBH7)编码F3'''''''''''''''''''''''''''''''''''''''''''''' - 羟基化类黄酮的B环。我们的研究丰富了可用于Lamiaceae家族的基因组信息,并提供了一种用于发现类黄酮装饰涉及的CYP450基因的工具包。
引言有机阴离子转运蛋白1(OAT1/SLC22A6)的功能被认为是许多小带负电荷有机分子从血液中移动到尿液中的速率限制步骤(1)。是原始的SLC和ABC药物转运蛋白之一,该转运蛋白被FDA突出显示用于测试与新药物实体的相互作用(1-3)。这是由于其在排泄许多药物(例如抗生素,抗病毒药,NSAID,利尿剂)中的作用(2,4,5)。最近的研究发现了其在调节系统性和肾脏代谢以及信号传导中涉及的内源性途径中的关键作用。在小鼠模型中使用体外传输数据和OAT1的体内KO已被用于识别该转运蛋白处理的内源代谢产物。这些研究(6-9)表明,OAT1 -KO小鼠中的许多代谢产物源自肠道微生物。OAT1以及其他SLC和ABC“药物”转运蛋白(例如OATP1B1,MRP2,ABCG2)被认为是由> 500蛋白组成的拟议遥感和信号网络中的关键系统和器官中心(2,10,11)。遥感和信号传导理论(RSST)认为,这种基因网络部分与调节药物吸收,分布,代谢和排泄的基因重叠(ADME),可维持体内众多内源性小分子的体内平衡(2,12,12,13,13)。当慢性肾脏疾病期间肾功能降低时,在人体病理生理中作用中遥感和信号系统的一个例子(12)。当肾脏不再能够有效地处理尿酸盐时,嘌呤代谢和抗氧化剂的常见终端产生会导致尿酸盐的积累会导致痛风,高血压和肾脏和心血管疾病的进展(14)。结果,肠道改变了ABCG2的表达和/或功能,并部分远程补偿受损的肾脏,从而通过将其排泄到肠道中来消除血液(15)。
摘要:机器学习(ML)技术的应用是协助诊断复杂疾病的可靠方法。最近的研究将肠道微生物的组成与自闭症谱系障碍(ASD)的存在有关,但到目前为止,结果主要是矛盾的。这项工作建议使用机器学习研究肠道微生物组组成及其在ASD早期诊断中的作用。我们使用肠道微生物组成分的公开数据,将支持向量机(SVM),人工神经网络(ANN)和随机森林(ANN)和随机森林(RF)算法分类为神经型(NT)或具有ASD的受试者。天真的贝叶斯,k-neart邻居,合奏学习,逻辑回归,线性回归和决策树也经过训练和验证;但是,提出的表现最好的性能和解释性。使用SAS VIYA软件平台开发了所有ML方法。使用16S rRNA测序技术确定微生物组的组成。ML的应用产生的分类准确性高达90%,灵敏度为96.97%,特异性较高达到85.29%。在ANN模型的情况下,与第一个数据集对NT受试者进行分类时不会发生任何错误,这表明与传统测试和基于数据的方法相比,分类结果显着。使用两个数据集重复这种方法,一个来自美国,另一个来自中国,导致了类似的发现。所获得的模型中的主要预测指标在分析的数据集之间有所不同。从分析的数据集中确定的最重要的预测因素是细菌,lachnospira,anaerobutyricum和ruminococcus torques。值得注意的是,在每个模型中的预测因子中,由于其相对丰度较低,因此存在细菌在微生物组组成中通常被认为是微不足道的。这种结果增强了对微生物组对ASD发展的影响的常规理解,在这种情况下,微生物群的组成的不平衡会导致宿主 - 微生物稳定的破坏。考虑到以前的几项研究集中在最丰富的属,并且被忽略了较小的(并且经常在统计学上显着)微生物群落,因此对此类社区的影响进行了很差的分析。基于ML的模型表明,更多的研究应集中在这些不太丰富的微生物上。一个新的假设解释了这一领域的矛盾结果,并提倡对可能不会表现出统计学意义的变量进行更深入的研究。获得的结果似乎有助于解释有关ASD的矛盾发现及其与肠道菌群组成的关系。虽然某些研究将杆状杆菌/杆菌的比例较高,而其他研究则相反。这些差异与微生物组组成中的少数族裔有密切相关,这在人群之间可能有所不同,但具有相似的代谢功能。因此,在ASD表现中,杆菌/杆菌的比率可能不是决定因素。
数千年来,人类一直享受着微生物在发酵食品和饮料中提供的新口味、更长的保质期和营养价值。最近的发酵测序调查已经绘制了跨空间、时间和生产实践的微生物多样性模式。但对发酵食品微生物组如何组装的机制理解直到最近才开始出现。以三种食物(表面成熟的奶酪、酸面团发酵剂和发酵蔬菜)为例,我们使用生态和进化框架来确定微生物群落在发酵过程中的组装方式。通过将原位测序调查与体外模型相结合,我们开始了解扩散、选择、多样化和漂移如何产生发酵食品群落的多样性。大多数食品生产商并不知道他们的生产环境中正在发生的生态过程,但生态学和进化的理论和模型可以为管理从农场到发酵的发酵食品微生物组提供新方法。
量子优化算法与医疗保健部门特别相关,并且在复杂的计算问题以及需要高计算能力的计算问题方面可能具有竞争优势。是基因组学的情况,当前存在基因组优化问题[3],[4],[5](例如基因组组装),其计算复杂性正在迅速增加,并且经典的计算方法在试图解决它们时会遇到很大的困难。该领域中的量子计算可以导致更准确的基因组组件和更快的遗传疾病诊断。在医疗保健中,量子计算也可以用于医学成像和个性化医学。量子算法可以分析大量医学图像,从而使医生能够更快地检测和诊断疾病。个性化医学涉及针对个人的特定遗传组成裁缝,量子计算可以帮助分析大量遗传信息数据集以识别最佳治疗方法。此外,通过使用基于量子计算的技术,在分析大规模健康数据集时,健康分析可能更快,更准确。例如,它可能会加快对电子健康记录(EHR)的分析,并可以对健康和护理专业人员进行更准确的分析,同时识别疾病暴发的模式和趋势,并为更好的知情决策做出更好的决定,例如,处方优化和有效性。
1 哥本哈根大学全球研究所进化全息基因组学中心,丹麦哥本哈根,2 圣地亚哥动物园野生动物联盟贝克曼保护研究中心,美国加利福尼亚州埃斯孔迪多,3 俄罗斯新西伯利亚俄罗斯科学院分子与细胞生物学研究所基因组多样性与进化系,4 俄罗斯新西伯利亚新西伯利亚州立大学自然科学系,5 美国德克萨斯州休斯顿贝勒医学院分子与人类遗传学系基因组结构中心,6 美国德克萨斯州休斯顿莱斯大学理论生物物理中心和计算机科学系,7 美国马萨诸塞州剑桥麻省理工学院和哈佛大学布罗德研究所,8 美国加利福尼亚州圣地亚哥 Bionano Genomics 研究与开发系,9 俄罗斯圣彼得堡 ITMO 大学 SCAMT 研究所应用基因组学实验室,10物种生存中心,史密森尼国家动物园和保护生物学研究所,弗吉尼亚州弗兰特罗亚尔,美国,11 沃尔特·里德生物系统学部,博物馆支持中心 MRC-534,史密森尼学会,马里兰州苏特兰,美国,12 沃尔特·里德陆军研究所,马里兰州银泉,美国,13 马里兰州洛约拉大学,马里兰州巴尔的摩,美国,14 保护基因组学中心,史密森尼国家动物园和保护生物学研究所,华盛顿特区,美国,15 乔治梅森大学史密森尼-梅森保护学院,弗吉尼亚州弗兰特罗亚尔,美国
摘要 性别决定是脊椎动物成功发育的关键要素,这表明性染色体系统可能在各个谱系中都具有进化稳定性。例如,哺乳动物和鸟类在漫长的进化时期内保持了保守的性染色体系统。相比之下,其他脊椎动物经历了频繁的性染色体转换,这更加令人惊奇,因为我们对它们各自的系统发育的大部分了解仍然很少。一种特殊的爬行动物群,壁虎蜥蜴(壁虎亚目),在性染色体转换方面表现出极高的不稳定性,并且可能拥有鳞目动物(蜥蜴和蛇)中的大多数转换。然而,大多数壁虎物种缺乏关于性染色体的详细基因组和细胞遗传学信息,这给我们对进化过程的理解留下了巨大的空白。为了解决这个问题,我们组装了壁虎(Sphaerodactylidae:Sphaerodactylus)的染色体水平基因组,并利用该组装数据在六个密切相关的物种中寻找性染色体,其中使用了各种基因组数据,包括全基因组重测序、RADseq 和 RNAseq。之前的研究已经在两种 Sphaerodactylus 壁虎中发现了 XY 系统。我们在那项工作的基础上扩展了该属中两到四个性染色体顺式转换(XY 到新的 XY)。有趣的是,我们确认了两种不同的连锁群为 XY 性染色体系统,而此前人们并不知道它们在四足动物中充当性染色体(与 Gallus 的 3 号染色体和 Gallus 的 18/30/33 号染色体同源),进一步突显了一个独特而令人着迷的趋势,即大多数连锁群都有可能充当有鳞动物的性染色体。
本论文由 DigitalCommons@CSB/SJU 免费提供给您,供您开放访问。它已被 DigitalCommons@CSB/SJU 的授权管理员接受,并被纳入庆祝奖学金和创造力日 (2018-)。有关更多信息,请联系 digitalcommons@csbsju.edu。
