摘要 - 基于EEG的神经网络,医学诊断和脑部计算机界面的关键,由于依赖敏感的神经生理数据和资源密集型发展,面临着重要的知识产权(IP)风险。当前的水印方法,尤其是使用抽象触发器集的方法,缺乏强大的身份验证,并且无法解决EEG模型的独特挑战。本文介绍了针对基于EEG的神经网络量身定制的基于密码的Wonder滤清器水印框架。利用抗碰撞的哈希功能和所有者的私钥,Wonder Filter在训练过程中嵌入了位水印,可确保最小的失真(EEG任务准确性下降5%)和高可靠性(100%水印检测)。该框架是针对对抗性攻击的严格评估,包括微调,转移学习和神经元修剪。的结果表明,即使在积极的修剪后,水印状态的分类准确性仍然超过90%,而主要的任务绩效降低了速度,却阻止了去除尝试的速度。盗版性耐药性通过无法嵌入次级水印而没有严重准确性损失(在EEGNET和CCNN模型中> 10%)来验证。加密散列可确保身份验证,从而降低了蛮力攻击成功概率。在DEAP数据集上进行了跨模型(CCNN,EEGNET,TSEPTION)的评估,该方法达到了> 99。4%的无效剂量准确性,有效地消除了误报。通过将Wonder过滤器与EEG特异性改编整合在一起,这项工作弥合了神经生理模型的IP保护方面的关键差距,为医疗保健和生物识别应用提供了安全的,防篡改的解决方案。该框架针对对抗性修饰的鲁棒性强调了其在维护诊断效用的同时维护敏感的脑电图模型的潜力,从而促进了对AI驱动的生物医学技术的信任。
蛋白质结构是理解蛋白质功能的关键,对于生物工程,药物发现和分子生物学的进展至关重要。最近,随着生成AI的结合,计算蛋白结构预测/设计的功率和准确性已得到显着提高。然而,诸如版权保护和有害内容产生(生物安全)等道德问题对蛋白质生成模型的广泛实施构成了挑战。在这里,我们研究是否可以将水印嵌入蛋白质生成模型及其输出中,以进行版权认证和跟踪生成的结构。作为概念证明,我们提出了一个两阶段的方法折叠标记,作为蛋白质生成模型的广义水印策略。FOLSMARK首先要预处理水印编码器和解码器,它们可以轻微调整蛋白质结构以嵌入用户特定的信息,并忠实地从编码结构中恢复信息。在第二步中,蛋白质生成模型通过水印条件的低级适应(Waterlora)模块进行微调,以保持发电质量,同时学习产生具有高回收率的水印结构。广泛的实验是在开源蛋白结构预测模型(例如Esmfold和Multiflow)和从头结构设计模型(例如Framediff和Foldflow)上进行的,我们证明我们的方法在所有这些生成模型中都是有效的。同时,我们的水印框架只会对原始蛋白质结构质量产生可忽略的影响,并且在潜在的后加工和适应性攻击下具有强大的影响。
在实践中,在训练 AI 模型时,训练数据的标记主要用于对图像进行分类(例如汽车或动物)。另一方面,文本的标记有助于识别情绪或特定关键词。对于旨在识别语音的 AI 系统的训练,标记还可以包括转录录音或识别音频输入文件中的特定噪音(例如背景中的交通或飞机)。
DeepFake模型滥用构成了主要的安全性。现有的被动和主动的深层检测方法都缺乏义务和鲁棒性。在这项研究中,我们提出了一个可插入式有效的活性模型水印框架以进行深泡泡检测。这种方法促进了识别水印在各种深层生成模型中的嵌入,使当局能够轻松提取它们以进行检测。具体来说,我们的方法利用生成模型解码器中的通用卷积结构。它采用自适应水嵌入定位的结合内核稀疏性,并引入了汇总内核的归一化,以无缝地与固有模型的水印参数无缝。对于水印提取,我们基于深层检测模型共同训练水印提取器,并使用BCH编码有效地识别水印图像。最后,我们将方法应用于八种主要类型的深泡剂模型。实验表明,即使在沉重的损失通道中,我们的方法可成功地检测到平均准确性超过94%的深烟。这种方法独立于发电模型的培训,而不会影响原始模型的性能。此外,我们的模型需要培训数量非常有限的参数,并且对三种主要的自适应攻击具有弹性。可以在https://github.com/guaizao/pluggable-watermarking
指纹识别(或复制检测)存储数据库中所有AI生成内容的哈希,例如。Neuralhash(Apple Inc.,2021年)。这些哈希是向量表示∈{0,1} k或r k通常是由自我保护的特征提取器生成的(Oquab等人。,2023; Devlin等。,2018年)。查询一块内容时,我们将其哈希与数据库中的哈希进行了比较,并确定它是否是重新发电的副本。在大规模上,存储哈希并通过它们进行搜索很麻烦,并且反向搜索必须近似以易于处理(Douze等人。,2024)。此外,功能提取器对内容修改并不完全鲁棒:例如,音频及其×1.25速度版本可能具有不同的哈希。这两个因素会导致错误,尤其是在对抗环境中(Douze等人,2021; Papakipos等。,2022)。另一个缺点是需要将哈希存储在数据库中,这使得很难共享,而开源场景不可能。
虽然 PEST 与现有的非线性参数估计软件有一些相似之处(它使用一种功能强大且稳健的估计技术,该技术已在各种问题类型上进行了广泛的测试),但它的设计理念却截然不同。PEST 的新颖之处在于它允许您使用特定模型进行参数估计和/或数据解释,而无需对该模型进行任何更改。因此,PEST 可以适应现有模型,您无需让您的模型适应 PEST。通过将 PEST 包装在您的模型上,您可以将其变成您的模型模拟的系统的非线性参数估计器或复杂的数据解释包。该模型可以是简单的或复杂的,自制的或购买的,并且可以使用任何编程语言编写。
我们发起了针对量子对手的软件水印研究。量子对手会以盗版软件的形式生成量子状态,从而可能从经典标记软件中删除嵌入的消息。从量子盗版软件中提取嵌入的消息非常困难,因为测量可能会不可逆地改变量子状态。在针对经典对手的软件水印中,消息提取算法关键是使用经典盗版软件的(输入-输出)行为来提取嵌入的消息。即使我们用量子安全构建块实例化现有的水印 PRF,由于上述量子特定属性,它们是否对量子对手安全尚不清楚。因此,我们需要全新的技术来实现针对量子对手的软件水印。在这项工作中,我们为量子对手(对量子对手不可移除)定义了安全水印 PRF 和 PKE。我们还介绍了两个水印 PRF 和一个水印 PKE,如下所示。
因此,全球的政策制定者都在思考如何设计和实施水印技术,以确保值得信赖的人工智能环境。中国已经采取措施禁止没有水印的人工智能生成图像。美国政府的任务是开发有效的标签和内容来源机制,以便最终用户能够确定内容何时是使用人工智能生成的,何时不是。G7 要求公司开发和部署可靠的内容认证和来源机制,例如水印,以使用户能够识别人工智能生成的内容。欧盟于 2023 年 12 月临时达成的新人工智能法案对人工智能系统的提供者和用户提出了一些义务,以便能够检测和追踪人工智能生成的内容。履行这些义务可能需要使用水印技术。
第 2 章 应用和属性 15 2.1 水印的应用
生成的AI(Genai)技术,例如语言模型(LMS)和扩散模型,具有令人印象深刻的功能。这些功能包括文本学习,代码完成,文本到图像生成以及文档和代码聊天。然而,Genai技术也用于邪恶目的(例如,产生伪造的推文,产生攻击和有害散文)。To protect against such use cases, a large body of work has focused on detecting AI-generated content (Lavergne et al., 2008; Beresneva, 2016; Gehrmann et al., 2019; Zellers et al., 2019; Mitchell et al., 2023; GPTZero, 2023; Hendrik Kirchner et al., 2023).问题是:给定内容C,C是由特定的Genai工具生成的,例如GPT-4(OpenAI,2023),Gemini(Google DeepMind,2024)或稳定的扩散(Rombach等,2022)?非正式地,我们想要“ Genai Turing测试”。目前,试图检测任意AI生成的文本的主要方法是训练另一个AI模型以执行检测(Zellers等,2019; Mitchell等,2023; Gptzero,2023; Hendrik Kirchner等人,2023年,2023年)。此方法提出了一个关键的假设:AI生成的文本具有可通过AI识别的嵌入功能。这个假设的关键问题是,生成模型是明确设计的,以产生很难与自然内容(由人类或自然产生的)区分的现实内容。结果,随着生成模型的改善,任何“黑盒”检测方案都将遭受高误报和/或假阴性率。这些水印技术改变了生成过程,将“信号”嵌入生成的内容中。可用的探测器,例如Gptzero(Gptzero,2023)无法保证正确性 - 例如,作者直接指出,不应使用其工具引起的检测来谴责学生。为了避免这个基本问题,最近的一项工作(Aaronson,2023; Kirchenbauer等,2023; Christ等,2024; Kuditipudi等,2024)采取了另一种方法来检测AI含量。检测过程衡量信号:如果信号足够强,则可能是水标水标的。特别是Christ等人的加密方法。(2024)实现正式的完整概念(将检测到任何水印的文本),健全性(一个人不知道秘密而不能在文本上加水印)和失真(水印不会改变输出分布)。最后,这些水印