我们提出了退火突变近似景观 (AMaLa),这是一种从定向进化实验测序数据推断适应度景观的新方法。定向进化实验通常从单个野生型序列开始,该序列经历达尔文体外进化,通过多轮突变和选择达到目标表型。近年来,定向进化正在成为一种在受控实验条件下探测适应度景观的有力工具,并且由于对不同轮次进行了高通量测序,定向进化成为开发准确统计模型和推理算法的相关试验场。适应度景观建模策略要么使用变体的丰富度作为输入数据,因此需要在不同轮次观察相同的变体,要么简单地假设最后一轮测序的变体是平衡采样过程的结果。 24 AMaLa 旨在有效利用所有序列轮次的时间演化中编码的信息。为此,一方面,我们假设序列轮次之间存在统计抽样独立性,另一方面,我们用时间相关的统计权重来衡量序列空间中所有可能的轨迹,该权重由两个贡献组成:(i)一个解释选择过程的统计能量项,(ii)一个简单的广义 Jukes-Cantor 模型来描述纯突变步骤。30 这种简单的方案使我们能够准确地描述具体实验设置中的定向进化动力学,并推断出一个适应度景观,该景观可以正确再现选择下的表型(例如抗生素耐药性)的测量值,明显优于广泛使用的推理策略。我们通过展示推断的统计 34 模型如何用于预测野生型序列的相关结构特性,以及如何重现未用于训练模型的大规模功能筛选的突变效应,来评估 AMaLa 的可靠性。36
主要关键词