来自癌症患者的基因组数据代表了患者基因突变的存在与癌症发生之间的关系。人类中不同类型的癌症被认为是由两个至九个基因突变的组合引起的。通过传统的详尽搜索来识别这些组合,需要与组合大小成倍扩展的计算量,即使对于尖端超级计算机也是棘手的。我们提出了一种无参数的启发式方法,该方法利用基因患者突变的内在拓扑来鉴定致癌组合。通过使用它们来预测以前看不见的样品中肿瘤的存在来测量鉴定组合的生物学相关性。所得的16种癌症类型的分类器在详尽的搜索结果中表现出色,平均敏感性为80.1%的敏感性和91.6%的特异性,每种癌症类型的命中率最佳选择。我们的方法能够找到较高的致癌组合靶向,这将需要多年的计算进行详尽的搜索。
M. M. Zedouc 1,†,Caire Blin 2, *,†,Nico L.L.louwen 1,豪尔赫(Jorge)的名字,1,卢雷罗(Loureiro)1,Chantal D. Bader 3,Constance B。女人3、6,何塞D.D。节日7,猜测14,我不知道Hanif 15,Eric J.N.由55、70、75,Rile和S59、60,拉奎尔hag AS 67,力量Charri 25,77,77,Hyukjae Choi Chroy 83,Melinda S31,夏洛特和OW,32岁, Robin T以弗39, Al-Sumukh A. Alharthi 52,Mariela Rojo 53,Amr A. Arishi Avalon 56,J。Abr和Av Elar-Rivas 57,Kyle K. AXT 34,Hellen B克里斯汀·比梅尔曼斯(Christine Beemelmanns)3,24, Ricardo M. Borges 67,Rainer Bordes 68,69,Milena Breit 16,17, Cano-Prieto 2,Joy 74,Victor J.31,夏洛特和OW,32岁, Robin T以弗39, Al-Sumukh A. Alharthi 52,Mariela Rojo 53,Amr A. Arishi Avalon 56,J。Abr和Av Elar-Rivas 57,Kyle K. AXT 34,Hellen B克里斯汀·比梅尔曼斯(Christine Beemelmanns)3,24, Ricardo M. Borges 67,Rainer Bordes 68,69,Milena Breit 16,17, Cano-Prieto 2,Joy 74,Victor J.JéromeCollemare 82,JAC。路易斯·卡莱布·达马斯·拉莫斯(Luis Caleb Damas-Ramos 2),达米亚尼(Damiani)87的泰特斯(Titus of Damiani 87在1 95,Erin A. Garza 96,Athina Gavriilidou 23,Andrea Gentiles 97,98,Jennif,hans Gerstmans 100,101,102, Greco 52,Juan E. Green 46,Sebastian War 7,9,Shaday Flores 104, 107,Kristina Haslinger 108,Beibel He 109 109 109 87,Jethro L. Hemmann 110,Hindr和Hindr和1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 113 h 2,当耶和华AB 1,114,115,Thanh-Hau Huynh 116和手2,Eunah Jeong 81,Jiayi Jing 1,Jung Jng 116,Yong Kang 116, 121,金122,罗伯特·A。
在2015年,我们定义了有关生物合成基因簇(Mibig)的最小信息:一种标准化的数据格式,描述了最小必需的信息,以独特地表征BGC。我们同时以这种格式构建了一个随附的BGC条目的在线数据库,此后,该数据被社区广泛用作BGC的参考数据集。在这里,我们描述了Mibig 3.0,一个数据库更新,包括大规模验证和重新通知现有条目,与自然产品ATLAS数据库的广泛交联以及669个新条目。特别关注复合结构和生物活性的注释以及蛋白质领域的选择性。在一起,这些新功能使数据库保持最新,并将为科学社区提供新的机会,以便使用其免费可用的数据,例如培训新机器学习模型,以预测各种天然产品的序列结构功能关系。
