* 通信作者 E⁃mail: zhengbin@nipd.chinacdc.cn ; ORCID: 0000⁃0002⁃1768⁃7609 [数字出版日期] 2024⁃06⁃17 13:42:02 [数字出版网址] https://link.cnki.net/urlid/32.1374.R.20240613.1443.002
潜在的生成模型(例如,稳定的扩散)变得越来越流行,但是关于这些模型产生的图像的潜在滥用,出现了概念。因此,有必要通过推断特定的潜在生成模型来分析特定图像来分析图像的起源。大多数现有的方法(例如,图像水印和模型指纹打印)在训练或发电过程中需要额外的步骤。这些要求限制了它们在生成的图像上的使用情况,而无需此类操作,额外的操作可能会损害生成的图像的质量。在这项工作中,我们询问是否有可能有效,有效地追踪具有上述要求的特定潜在生成模型所产生的图像。为了研究此问题,我们设计了一种基于潜在反转的方法,称为L atent t Racer,以通过检查检查的图像是否可以使用倒置的潜在输入来构造了检查的图像,以追踪检查模型的固定图像。我们利用基于级别的潜在反转,并确定基于编码的初始化对我们方法的成功至关重要。我们对最先进的潜在生成模型(例如稳定的扩散)进行的实验表明,我们的方法可以以很高的精度和效率来区分被检查模型和其他IMEGES生成的图像。我们的发现表明,当今的潜在生成生成的图像自然是由源模型中使用的解码器自然水印的有趣可能性。代码:https:// github。com/zhentingwang/litenttracer。
深度伪造 给深度伪造添加水印可能有助于识别一些人工智能生成的音频、照片和视频,但它并不能解决这些内容的创作和传播背后的恶意,尤其是在政治背景下。在政治领域,不良行为者可能会部署深度伪造,以虚假的方式展示公众人物说或做他们从未做过的事情,目的是左右舆论或影响选举。即使水印表明视频是人工智能生成的,这些人仍然可以传播它来误导观众,因为他们依赖许多人会忽视或误解水印的可能性。同样,当深度伪造的目的是让某人难堪或骚扰时,即使水印成功地提醒大多数人内容是由人工智能生成的,深度伪造仍可能达到其预期效果。此外,使用 GenAI 并不是制作看似逼真的欺骗性媒体的唯一方法。个人可以手动创建欺骗性媒体,例如录制虚假音频的语音模仿者,或使用非人工智能数字工具,例如照片编辑软件来创建误导性图像。
摘要。目的:这项工作旨在应用量子希尔伯特(Hilbert)争夺,以增强图像水印的安全性和完整性,而不会影响视觉质量退化。对被调查方法的进一步概念可能会为传统的水印方法提供一个很好的解决方案,以通过新的量子计算概念解决数字图像安全性和完整性的一些问题。方法:本文回顾了量子希尔伯特(Hilbert)争夺,其计算复杂性为𝑂(𝑛22 2)。该过程涉及将图像编码为量子状态,并用希尔伯特曲线置换量子,并使用量子门嵌入水印。结果:定量性能评估指标,例如峰信号与噪声比(PSNR)和结构相似性指数(SSIM),显示出高峰信号与噪声比(PSNR)值的高峰值信号(PSNR)值,从56.13 dB到57.87 db至57.87 db,结构相似性指数(SIM)(SSIM)(SIM)(SIM)(SIM)(SIM)(SIM)来自0.9985至0.985至0.999990,相应地愿意。这证明了质量降解非常小,结构的细节得到很好的维护。新颖性:所提出的方法将量子计算与传统水印步骤集成在一起,以在数字水印中采用安全有效的方法。进一步的开发应集中于改善有关计算效率的量子电路,将方法的适用性扩展到广泛的图像上,以及在水印中的各种情况,并通过结合量子和经典方法来提高性能和可伸缩性,以找到混合方法。关键字:希尔伯特(Hilbert)争夺,图像水印,量子希尔伯特(Hilbert)争夺,2024年7月收到的绩效测量 / 2024年10月修订 / 2024年11月接受的这项工作已在创意共享4.0国际许可下获得许可。
数字水印可以嵌入媒体中,这有助于检测后续的深度伪造。一种形式的水印会添加计算机可检测但人类无法察觉的像素或音频模式。这些模式会在任何被修改的区域中消失,从而使所有者能够证明媒体是原始媒体的更改版本。另一种形式的水印会添加一些功能,使使用该媒体制作的任何深度伪造看起来或听起来都不真实。 元数据(描述媒体中数据的特征)可以以加密安全的方式嵌入。缺失或不完整的元数据可能表明媒体已被更改。 区块链。将媒体和元数据上传到公共区块链会创建一个相对安全的版本,该版本无法更改,否则其他用户会发现更改。然后任何人都可以将文件及其元数据与区块链版本进行比较,以证明或反驳真实性。
随着图像生成器的质量不断提高,深层蛋糕成为社会辩论的一个话题。图像水印允许负责任的模型自动检测和标记其AI生成的内容,从而减轻危害。然而,图像水印中的当前最新方法仍然容易受到伪造和去除攻击的影响。这种脆弱性发生在部分原因是水印会扭曲产生的图像的分布,无意中揭示了有关水印技术的信息。在这项工作中,我们首先根据扩散模型的初始噪声展示了一种无误的水印方法。但是,检测水印需要将图像重建的初始噪声与所有先前使用的初始噪声进行比较。为了减轻这些问题,我们提出了一个两阶段的水印框架,以进行有效检测。在生成期间,我们通过生成的傅立叶模式增加了初始噪声,以嵌入有关我们使用的初始噪声组的信息。为了检测,我们(i)检索相关的噪声组,以及(ii)在给定组中搜索可能与我们的图像相匹配的初始噪声。这种水印方法实现了对大量攻击的伪造的最新鲁棒性和去除。
在上面的屏幕中,我们可以看到从水印图像中提取的二进制值,然后单击“用原始图像编码加密的水印对”按钮隐藏原始图像中的加密水印
我们介绍了生成图像模型的第一个不可检测的水印方案。无法检测到可确保即使在进行许多适应性查询之后,也没有有效的对手可以区分被水标和未加水标的图像。尤其是,在任何有效计算的度量标准下,无法检测到的水印不会降低图像质量。我们的方案通过使用伪和误差校正代码(Christ and Gunn,2024)选择扩散模型的初始潜在,该策略保证了不可检索性和鲁棒性。我们在实验上证明,使用稳定的扩散2.1,我们的水印是质量的和稳健的。我们的实验验证,与我们测试的事先方案相比,我们的水印不会降低图像质量。我们的实验也证明了鲁棒性:现有的水印去除攻击无法从图像中删除我们的水印,而不会显着降低图像的质量。最后,我们发现我们可以在水痕迹中强牢固地编码512位,当图像未受到水印去除攻击时,最多可达2500位。我们的代码可在https://github.com/xuandongzhao/ prc-watermark上找到。