Meta 创造了一种给人工智能生成的语音加水印的方法

Meta 创建了一个系统,可以在 AI 生成的音频片段中嵌入隐藏信号(称为水印),这有助于在线检测 AI 生成的内容。这款名为 AudioSeal 的工具是第一个可以精确定位哪些音频片段(例如,一个完整的一小时播客)可能是由 AI 生成的工具。它可以帮助……

来源:MIT Technology Review _人工智能

然而,也有一些重大警告。Meta 表示,它目前还没有计划将水印应用于使用其工具创建的 AI 生成音频。音频水印尚未得到广泛采用,也没有统一的行业标准。而且,AI 生成内容的水印往往很容易被篡改——例如,通过删除或伪造它们。

容易篡改

Elsahar 说,快速检测和精确定位音频文件中哪些元素是 AI 生成的,对于使系统有用至关重要。他说,该团队在检测水印方面的准确率达到了 90% 到 100%,比之前在音频上加水印的尝试要好得多。

AudioSeal 可在 GitHub 上免费获取。任何人都可以下载它并使用它来为 AI 生成的音频片段添加水印。它最终可以叠加在 AI 音频生成模型之上,从而自动应用于使用它们生成的任何语音。创建它的研究人员将于 7 月在奥地利维也纳举行的国际机器学习会议上展示他们的工作。

GitHub

AudioSeal 是使用两个神经网络创建的。一个生成可以嵌入音轨的水印信号。这些信号对人耳来说是不可察觉的,但可以使用另一个神经网络快速检测到。目前,如果您想尝试在较长的剪辑中发现 AI 生成的音频,您必须以秒为单位梳理整个内容,看看其中是否有任何包含水印。这是一个缓慢而费力的过程,在拥有数百万分钟语音的社交媒体平台上并不实用。

AudioSeal 的工作方式不同:通过在整个音轨的每个部分嵌入水印。这允许水印“本地化”,这意味着即使音频被裁剪或编辑,它仍然可以被检测到。