详细内容或原文请订阅后点击阅览
DeepMind 在语音信号生成方面取得新进展
谷歌的 DeepMind 部门致力于创造“超级智能”计算机,该部门创建了一个自动生成语音信号的系统,据说比现有模型优越 50%。
来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)谷歌的 DeepMind 部门致力于创造“超级智能”计算机,该部门创建了一个自动生成语音信号的系统,据说比现有模型优越 50%。
英国公司DeepMind于2014年被谷歌以约4亿英镑(5.33亿美元)的价格收购,该公司已因其AlphaGo程序而闻名,该公司开发了一种名为WaveNet的人工智能,可以通过研究单个声波的形成方式来模仿人类语音以人声。
在美式英语和中文的盲测中,听众认为 WaveNet 生成的语音听起来比 Google 的其他文本转语音程序(依赖于不同技术)生成的语音更自然。但 WaveNet 的结果甚至比记录真实的人类语音还要糟糕。
许多计算机语音合成程序的工作原理是获取一个人的简短语音片段的大型数据集,然后将它们组合成新单词。结果,我们得到了清晰但不完全自然的声音。缺点是声音很难改变。其他系统完全以电子方式生成语音,通常基于有关单个字母组合如何发音的规则。这些系统允许您操纵自己的声音,但它们听起来不如基于人类录音的计算机合成语音自然。
WaveNet 是一种称为神经网络的人工智能,旨在模仿人脑的部分功能。此类网络需要使用大数据集进行训练。
计算机已经学会了理解口语,但它们自然说话的能力有些落后。