蛋白质结构是理解蛋白质功能的关键,对于生物工程,药物发现和分子生物学的进展至关重要。最近,随着生成AI的结合,计算蛋白结构预测/设计的功率和准确性已得到显着提高。然而,诸如版权保护和有害内容产生(生物安全)等道德问题对蛋白质生成模型的广泛实施构成了挑战。在这里,我们研究是否可以将水印嵌入蛋白质生成模型及其输出中,以进行版权认证和跟踪生成的结构。作为概念证明,我们提出了一个两阶段的方法折叠标记,作为蛋白质生成模型的广义水印策略。FOLSMARK首先要预处理水印编码器和解码器,它们可以轻微调整蛋白质结构以嵌入用户特定的信息,并忠实地从编码结构中恢复信息。在第二步中,蛋白质生成模型通过水印条件的低级适应(Waterlora)模块进行微调,以保持发电质量,同时学习产生具有高回收率的水印结构。广泛的实验是在开源蛋白结构预测模型(例如Esmfold和Multiflow)和从头结构设计模型(例如Framediff和Foldflow)上进行的,我们证明我们的方法在所有这些生成模型中都是有效的。同时,我们的水印框架只会对原始蛋白质结构质量产生可忽略的影响,并且在潜在的后加工和适应性攻击下具有强大的影响。
主要关键词