病毒序列的日益普及导致了许多优化的病毒基因组重建工具的出现。鉴于新工具的数量在稳步增加,识别能够在准确性和计算资源之间取得平衡的功能性和优化工具以及每种工具提供的功能变得非常复杂。在本文中,我们调查了用于人类病毒基因组重建的开源计算工具(包括流程),确定了这些工具之间的具体特性、特点、相似之处和不同之处。为了进行定量比较,我们基于病毒数据创建了一个开源重建基准。该基准测试是使用合成数据集和真实数据集执行的。对于前者,我们评估了使用具有模拟突变率、污染和线粒体 DNA 包含以及不同覆盖深度的不同人类病毒对重建过程的影响。我们还使用真实数据集评估了每个重建程序,以展示它们在现实场景中的表现。评估指标包括重建前后基因组之间的同一性、归一化压缩半距离和归一化相对压缩,以及重建基因组的长度、每个工具所花费的计算时间和资源的指标。该基准完全可重现,可在 https://github.com/viromelab/HVRS 免费获取。
•NIH微生物组资金•病毒蛋白研究背景•HVP工作组活动•人类病毒蛋白共同基金计划计划•预期结果 /可交付成果IHMC2024 < / div < / div>
APOBEC3 酶是先天免疫效应物,可将突变引入病毒基因组。这些酶是胞嘧啶脱氨酶,可将胞嘧啶转化为尿嘧啶。它们优先突变胞嘧啶,然后突变胸腺嘧啶,使 5'TC 基序成为它们的首选目标。病毒已经进化出不同的策略来逃避 APOBEC3 的限制。某些病毒会主动编码对抗 APOBEC3 的病毒蛋白,而另一些病毒则会被动面对 APOBEC3 的选择压力,因为 APOBEC3 靶向基序的基因组已经耗尽。因此,APOBEC3 在某些病毒的基因组上留下了进化的足迹。我们研究的目的是识别这些具有由 APOBEC3 塑造的基因组的病毒。我们分析了 33,400 种人类病毒的基因组,以了解 APO-BEC3 青睐的基序是否耗尽。我们证明 APOBEC3 选择压力影响至少 22% 的目前已注释的所有人类病毒物种。乳头瘤病毒科和多瘤病毒科是足迹最密集的家族;证明选择压力作用于全基因组和两条链。细小病毒科成员在足迹的大小和定位方面具有不同的目标。有趣的是,B19 红细小病毒的两条链上都存在大量 APOBEC3 足迹;这使得该病毒基因组成为 APOBEC3 青睐基序最干净的序列之一。我们还发现地方性冠状病毒科具有显著的足迹。有趣的是,在人畜共患的 MERS-CoV、SARS-CoV-1 和 SARS-CoV-2 冠状病毒上未检测到这样的足迹。除了全基因组足迹的病毒外,某些病毒仅在其基因组的很短部分上留下足迹。这种情况对于γ-疱疹病毒科和腺病毒科来说就是如此,它们的足迹位于裂解性复制起点上。在逆转录的 HIV- 1、HIV-2、HTLV-1 和 HBV 病毒的负链上也可以检测到轻微的足迹。总之,我们的数据说明了 APOBEC3 对人类病毒的选择压力程度,并确定了新的假定 APOBEC3 靶向病毒。