季节性人类流感病毒经历快速进化,导致每年流行的病毒株发生显著变化。这些变化通常是由适应性突变引起的,特别是抗原表位,即人类抗体靶向的病毒表面蛋白血凝素区域。在这里,我们描述了一套一致的数据驱动的病毒进化预测分析方法。我们的流程整合了四种类型的数据:(1)全球范围内收集的病毒分离株的序列数据,(2)发病率的流行病学数据,(3)流行病毒的抗原特征,以及(4)内在病毒表型。通过对这些数据的综合分析,我们可以获得流行菌株的相对适应度估计值和长达一年的进化枝频率预测值。此外,我们还获得了候选疫苗株对未来病毒种群保护的比较估计值,为预防性疫苗株选择提供了基础。在网站 previr.app 上可以获取从流感和 SARS-CoV-2 预测管道获得的持续更新的预测。