OpenAI 推出可复制人类声音的语音引擎,但尚未分享

出于对潜在滥用的担忧,该公司决定预览但不广泛发布该技术。这篇文章《OpenAI 推出可复制人类声音的语音引擎,但暂时不会分享》首先出现在 GreatAIPrompts:AI 提示、AI 工具和 AI 新闻上。

来源:GreatAIPrompts

2024 年 4 月 2 日:流行的 ChatGPT 背后的公司 OpenAI 宣布了 Voice Engine,这是一种新的文本转语音 AI 模型,可以根据 15 秒的录音片段创建合成声音。

2024 年 4 月 2 日: 语音引擎 声音

该技术于 2022 年底开发,有可能提供许多好处,例如阅读辅助、创作者的全球影响力以及为非语言人士提供个性化的语音选项。

语音引擎生成的音频
语音引擎生成的音频
语音引擎生成的音频

然而,尽管具有潜在的优势,但 OpenAI 决定预览该技术,但由于担心潜在的滥用,目前不会广泛发布它。

该公司最初计划于本月初启动一项试点计划,让开发人员注册语音引擎 API,但考虑到道德影响后缩减了计划。

语音引擎 API

OpenAI 在一份声明中表示:“我们选择预览但不广泛发布这项技术。我们希望语音引擎的预览既能凸显其潜力,又能激发人们增强社会韧性以应对越来越令人信服的生成模型带来的挑战。”

自去年以来,该公司一直在与精选的合作伙伴公司测试这项技术,要求他们同意使用条款,禁止未经同意的冒充,并要求被克隆声音的个人获得知情同意。

OpenAI 还在每个语音样本中都实现了水印,以帮助追踪其语音引擎模型生成的任何声音的来源。

为了应对语音克隆技术带来的潜在风险,OpenAI 为社会提出了三项建议:逐步淘汰银行账户的语音身份验证、教育公众了解欺骗性 AI 内容的可能性、加快开发追踪音频内容来源的技术。

语音克隆