人工智能声音现在与真实人类的声音无法区分

您是否认为您能够说出真正的人类声音和深层效果之间的区别?大多数人不能。

来源:LiveScience

我们大多数人可能都通过 Siri 或 Alexa 等个人助理体验过人工智能 (AI) 语音,它们平淡的语调和机械的传递方式给我们留下了这样的印象:我们可以轻松地区分人工智能生成的语音和真人语音。但科学家们现在表示,普通听众不再能够区分真人声音和“深度伪造”的声音。

人工智能

在 9 月 24 日发表在《PLoS One》杂志上的一项新研究中,研究人员表明,当人们聆听人类声音以及人工智能生成的相同声音版本时,他们无法准确识别哪些是真实的,哪些是虚假的。

PLoS One

“人工智能生成的声音现在就在我们身边。我们都曾与 Alexa 或 Siri 交谈,或者通过自动客户服务系统接听电话,”该研究的主要作者、伦敦玛丽女王大学心理学高级讲师纳丁·拉万 (Nadine Lavan) 在一份声明中表示。 “这些东西听起来不太像真实的人类声音,但人工智能技术开始产生自然的、听起来像人类的语音只是时间问题。”

纳丁·拉万

研究表明,虽然从头开始创建的通用声音并不被认为是真实的,但根据真人声音训练的声音克隆(深度伪造音频)被发现与现实生活中的对应声音一样可信。

科学家们向研究参与者提供了 80 种不同声音的样本(40 种人工智能生成的声音和 40 种真实人类的声音),并要求他们标记出他们认为是真实的和人工智能生成的声音。平均而言,只有 41% 的从头开始的人工智能声音被错误分类为人类,这表明在大多数情况下,仍然有可能将它们与真人区分开来。

拉万说,研究结果对道德、版权和安全具有潜在的深远影响。如果犯罪分子使用人工智能来克隆你的声音,那么绕过银行的语音身份验证协议或欺骗你的亲人转账就会变得更加容易。