使用 AWS HealthOmics 和 Amazon Bedrock AgentCore 加速基因组学变异解释

在这篇博文中,我们向您展示代理工作流程如何通过自然语言界面加速大规模基因组学管道的处理和解释。我们展示了一种全面的基因组变异解释器代理,它将自动化数据处理与智能分析相结合,以解决从原始 VCF 文件摄取到会话查询接口的整个工作流程。

来源:亚马逊云科技 _机器学习
基因组研究正处于变革的十字路口,测序数据的指数增长需要同样复杂的分析能力。根据千人基因组计划,典型的人类基因组与参考基因组有 4.1-500 万个位点不同,其中大多数变异是 SNP 和短插入缺失。当这些变异在个体之间聚集时,会导致通过多基因风险评分(PRS)捕获的疾病易感性差异。基因组分析工作流程很难将如此大规模的变异数据转化为可操作的见解。它们仍然分散,要求研究人员手动编排复杂的管道,涉及变异注释、质量过滤以及与 ClinVar 等外部数据库的集成。AWS HealthOmics 工作流程与 Amazon S3 表和 Amazon Bedrock AgentCore 共同为这些挑战提供了变革性的解决方案。 HealthOmics 工作流程支持注释变体调用格式 (VCF) 文件与富有洞察力的本体的无缝集成。随后,需要将带 VEP 注释的 VCF 文件转换为存储在优化的 S3 表中的结构化数据集,以提高跨大型变体队列的查询性能。在 Amazon Bedrock AgentCore 上运行的 Strands Agents SDK 提供了安全且可扩展的 AI 代理应用程序,以便研究人员无需专门的查询专业知识即可与复杂的基因组数据集进行交互。在这篇博文中,我们向您展示代理工作流程如何通过自然语言界面加速大规模基因组学管道的处理和解释。我们展示了一种全面的基因组变异解释器代理,它将自动化数据处理与智能分析相结合,以解决从原始 VCF 文件摄取到会话查询接口的整个工作流程。最重要的是,该解决方案消除了传统上限制专业生物信息学家进行基因组分析的技术专业障碍。这使得 clini