测试框架涵盖 11 项国际公认的关键 AI 伦理原则 • 解决 AI 系统的 5 大关注领域 • 最小可行产品 (MVP) 从 8 项原则开始 • 通过技术测试和流程检查进行自我评估
DNA甲基化的异常变化与癌变的早期阶段有关。确定循环肿瘤DNA(CTDNA)中这些表观遗传变化可以揭示潜在的生物标志物来早期诊断各种癌症。然而,分析此类数据会带来生物信息学挑战,因为在检测活检样本中低丰度的CTDNA信号方面缺乏灵敏度,这些ctDNA信号通常被包含数百个目标区域的库的复杂性所淹没。读取水平的甲基化分析有望由于稀有信号的广泛覆盖范围和高灵敏度,因此有望进行更深入的DNA甲基化检测。但是,由于缺乏能够生成适合基准科学家和专业生物信息学家的可解释报告的标准化工作流的缺乏,这种方法受到了阻碍。在这里,我们提出了一个生物信息学工作流,该工作流程检查下一代测序(NGS)数据并表征扩增子的读取级甲基化模式。与当前可用的其他工具相比,我们的方法旨在与高型,大规模的目标测定法一起使用。它有效地消除了从测序副产品(例如False CpG调用,二聚体和脱靶比对)得出的不希望的噪声。此外,为了容纳最新的NGS平台生成的大量数据,该工作流程可以并行处理与基于云的基于云和本地计算资源兼容的样品。此工作流程提供了DNA甲基化模式的全面可视化,并报告了读取水平的甲基化在“模式为a-a-a-a-feature”表中。在此表中,每个样品的扩增子层型单倍型(图案)的出现表示为“特征列”,并与实验中发现的所有模式一起汇总。这些读取级别的模式以及其他信息可用于开发机器学习算法,以重复收获真正的预测特征,并在预测癌症诊断时惩罚混淆信号。