详细内容或原文请订阅后点击阅览
Genomics England 使用 Amazon SageMaker 根据多模态数据预测癌症亚型和患者生存率
在这篇文章中,我们详细介绍了我们在创建两个概念验证 (PoC) 练习方面的合作,这些练习围绕多模态机器学习进行生存分析和癌症亚型分析,使用基因组(基因表达、突变和拷贝数变异数据)和成像(组织病理学幻灯片)数据。我们提供了关于使用 Amazon SageMaker 在 AWS 上构建复杂 ML 工作流的可解释性、稳健性和最佳实践的见解。这些多模态管道正在 Genomics England 癌症队列中使用,以增强我们对癌症生物标志物和生物学的理解。
来源:亚马逊云科技 _机器学习这篇文章与英格兰基因组学的弗朗西斯科·阿祖耶(Francisco Azuaje)共同撰写。
英格兰基因组学分析了英国国家卫生服务(NHS)的测序基因组,然后使研究人员使用数据来推进生物学研究。作为帮助人们更长寿,更健康的生活的目标的一部分,英格兰基因组学对使用机器学习(ML)更准确地识别癌症亚型和严重性的识别感兴趣。 To explore whether such ML models can perform at higher accuracy when using multiple modalities, such as genomic and imaging data, Genomics England has launched a multi-modal program aimed at enhancing its dataset and also partnered with the the AWS Global Health and Non-profit Go-to-Market (GHN-GTM) Data Science and AWS Professional Services teams to create an automatic cancer sub-typing and survival detection pipeline and explore its accuracy on publicly可用数据。
基因组学英国 AWS专业服务在这篇文章中,我们详细介绍了使用基因组(基因表达,突变和拷贝数变异数据)和成像(组织病理学幻灯片)数据的多模式机器学习进行两种概念验证(POC)练习。我们提供了有关与Amazon SageMaker在AWS上架构复杂ML工作流程的架构复杂ML工作流的最佳实践的见解。这些多模式管道用于英格兰癌症的基因组学上,以增强我们对癌症生物标志物和生物学的理解。
Amazon Sagemaker1。数据
癌症基因组图集(TCGA)表1。研究了所研究的不同癌症类型的输入数据大小。 。研究的不同癌症类型的输入数据大小的概述
表1。研究了所研究的不同癌症类型的输入数据大小。