定向进化(DE)是一种蛋白质工程技术,涉及诱变和筛选以搜索优化给定特性的序列(例如将有效绑定到指定目标)。不幸的是,潜在的优化问题不确定,因此引入的突变以提高指定特性可能是以未定的,但重要的属性为代价的(例如,亚细胞定位)。我们试图通过将折叠的正则化因子纳入优化问题来解决这个问题。正则化因子偏向于类似于蛋白质所属折叠族的序列的设计的搜索。我们将方法应用于具有与IgG-FC的官能测量值的大型蛋白质GB1突变体库。我们的结果表明,正则化优化问题会产生更多类似天然的GB1序列,而结合效率仅略有下降。特别是,在GB1折叠族的生成模型下,我们的设计的对数比没有正则化的生成模型高41-45%,而结合效果仅下降了7%。因此,我们的方法能够在竞争性状之间进行交易。此外,我们证明了我们的主动学习驱动方法可将湿lab负担降低,以识别最佳的GB1设计,相对于Arnold Lab在同一数据上的最新结果。