1 罗格斯大学系统与计算生物学中心,罗格斯癌症研究所;195 Albany St.,新泽西新不伦瑞克 08901 2 罗格斯大学先进生物技术与医学中心;679 Hoes Lane West,皮斯卡塔韦,新泽西州 08854 *通讯作者。电子邮件:bassel.ghaddar@gmail.com 摘要 围绕癌症微生物组的最新争议凸显了改进人类基因组数据微生物分析方法的必要性。我们开发了 PRISM,一种用于精确识别微生物和从低生物量测序数据中净化的计算方法。PRISM 可消除杂散信号,并在对 62,006 个已知真阳性和假阳性分类群的精选数据集进行基准测试时获得出色的性能。然后,我们使用 PRISM 从 CPTAC 和 TCGA 数据集中检测 8 种癌症类型中的微生物。我们在 CPTAC 中鉴定出胃肠道肿瘤中丰富的微生物组,并在胰腺肿瘤亚群中鉴定出与改变的糖蛋白质组、更广泛的吸烟史和更高的肿瘤复发风险相关的细菌。我们发现其他癌症类型和 TCGA 中的微生物相对稀疏,我们证明这可能反映了不同的测序参数。总体而言,PRISM 并不能取代黄金标准对照,但它可以实现更高置信度的分析,并揭示具有潜在分子和临床意义的肿瘤相关微生物。简介
App-a-thon 于 2024 年 2 月 26 日至 2024 年 4 月 26 日举行。App-a thon 的目标是评估 AutoML 应用于生物医学数据集的有效性。参与者根据他们之前的 ML 经验在两个挑战等级之间进行选择:ML 和高级 ML。ML 等级适用于可能没有太多数据科学经验但希望接触使用 AutoML 工具和生物医学数据的参与者。高级 ML 等级适用于具有数据科学经验并了解 ML 流程中各个步骤(例如数据预处理、特征工程和模型构建)的参与者。这两个等级都使用 AutoML 工具来研究提供的脑癌基因表达数据集。对于高级 ML 等级,参与者收到了额外的美国国家癌症研究所临床蛋白质组学肿瘤分析联盟 (NCI CPTAC) 数据集,如工作流程图所示(图 1)。