来自癌症患者的基因组数据代表了患者基因突变的存在与癌症发生之间的关系。人类中不同类型的癌症被认为是由两个至九个基因突变的组合引起的。通过传统的详尽搜索来识别这些组合,需要与组合大小成倍扩展的计算量,即使对于尖端超级计算机也是棘手的。我们提出了一种无参数的启发式方法,该方法利用基因患者突变的内在拓扑来鉴定致癌组合。通过使用它们来预测以前看不见的样品中肿瘤的存在来测量鉴定组合的生物学相关性。所得的16种癌症类型的分类器在详尽的搜索结果中表现出色,平均敏感性为80.1%的敏感性和91.6%的特异性,每种癌症类型的命中率最佳选择。我们的方法能够找到较高的致癌组合靶向,这将需要多年的计算进行详尽的搜索。
主要关键词