外染色体DNA(ECDNA)是癌症局灶性致癌基因扩增的中心机制,发生在大约15%的早期癌症和30%的晚期癌症中。ECDNA通过动态调节基因拷贝数并重新启动基因调节网络,驱动肿瘤形成,进化和耐药性。阐明ECDNA扩增的基因组结构对于理解肿瘤病理学和开发更有效的疗法至关重要。 配对的末端短阅读(Illumina)测序和映射已被用来使用断点图表示eCDNA扩增,其中将ECDNA的推断架构编码为图中的循环。 断点图的遍历已用于成功预测癌症样品中的ECDNA。 然而,在识别断点,复杂的重排和内部重复的鉴定以及ECDNA结构的细胞到细胞异质性的反卷积方面,短阅读技术在识别中固有限制。 长读技术,例如来自牛津纳米孔技术,具有改进推理的潜力,因为读取较长在映射结构变体方面更好,并且更有可能跨越重新排列或重复的区域。 在这里,我们提出了珊瑚(通过长读数的扩增完全重建),用于使用长阅读数据重建ecdna架构。 珊瑚重建可能使用二次编程的循环档案,同时优化重建的简约,解释了拷贝数和长阅读映射的一致性。 可用性:https://github.com/ampliconsuite/coral阐明ECDNA扩增的基因组结构对于理解肿瘤病理学和开发更有效的疗法至关重要。配对的末端短阅读(Illumina)测序和映射已被用来使用断点图表示eCDNA扩增,其中将ECDNA的推断架构编码为图中的循环。断点图的遍历已用于成功预测癌症样品中的ECDNA。然而,在识别断点,复杂的重排和内部重复的鉴定以及ECDNA结构的细胞到细胞异质性的反卷积方面,短阅读技术在识别中固有限制。长读技术,例如来自牛津纳米孔技术,具有改进推理的潜力,因为读取较长在映射结构变体方面更好,并且更有可能跨越重新排列或重复的区域。在这里,我们提出了珊瑚(通过长读数的扩增完全重建),用于使用长阅读数据重建ecdna架构。珊瑚重建可能使用二次编程的循环档案,同时优化重建的简约,解释了拷贝数和长阅读映射的一致性。可用性:https://github.com/ampliconsuite/coral与以前的基于简读的工具相比,珊瑚在广泛的模拟和9个数据集中的重建基本上改善了重建。随着长阅读的用法变得广泛,我们预计珊瑚将成为培养肿瘤中局灶性扩增的景观和演变的宝贵工具。
主要关键词