结果:在这项研究中,我们介绍了 GiantHunter,这是一种基于强化学习的工具,用于从宏基因组数据中识别 NCLDV。通过采用蒙特卡洛树搜索策略,GiantHunter 动态选择代表性的非 NCLDV 序列作为负训练数据,使模型能够建立稳健的决策边界。对严格设计的实验进行基准测试表明,GiantHunter 在保持竞争灵敏度的同时实现了高精度,与第二佳方法相比,F1 分数提高了 10%,计算成本降低了 90%。为了证明其实际效用,我们将 GiantHunter 应用于从长江沿岸的六个城市收集的 60 个宏基因组数据集,这些城市位于三峡大坝的上游和下游。结果显示,NCLDV 多样性的显著差异与大坝的距离有关,这可能是由于大坝导致的流速降低所致。这些发现凸显了 GiantHunter 有潜力促进我们对 NCLDV 及其在不同环境中的生态作用的理解。
主要关键词