微软开放对文本转语音人工智能的有限访问

自定义神经语音是 Azure AI 服务的一部分,允许开发人员创建自己的合成语音。公司可以将这项技术用于智能助手和声控设备、聊天机器人、在线学习以及阅读有声读物或新闻等。

来源:Robogeek新闻频道(关于机器人技术的俄罗斯与世界新闻)

自定义神经语音是 Azure AI 服务的一部分,允许开发人员创建自己的合成语音。公司可以将这项技术用于智能助手和声控设备、聊天机器人、在线学习以及阅读有声读物或新闻等。

微软表示,该技术可以使声音听起来比许多其他文本转语音服务更自然。自定义语音使用一组声音来创建语音字体。自定义神经语音使用多个神经网络来尝试确保韵律(每个音素的音调和持续时间)和发音的准确性。这有助于AI正确模仿演员的声音。

一些公司已经在使用这项技术,包括 AT&T 和华纳兄弟。在达拉斯的 AT&T 体验店,人们可以与兔八哥互动。结合定制神经语音、增强现实和 5G,卡通兔子可以与顾客实时交流,并在商店里走动,帮助他们找到隐藏的金胡萝卜。

目前为兔八哥配音的演员 Eric Bauza 录制了 2,000 多句台词和短语来创建语音字体。华纳兄弟。和微软合作创建了反映角色个性和语气的自定义声音。 Duolingo 还使用自定义神经语音创建古怪的角色来帮助人们学习新语言,而 Progressive 正在为其聊天机器人 Flo 开发技术。

视频