推动音频发电的前沿

我们开创性的语音生成技术正在帮助世界各地的人们与更自然,对话和直观的数字助手和AI工具互动。

来源:DeepMind - 新闻与博客

研究

推动音频发电的前沿

发布于2024年10月30日AuthorszalánBorsos,Matt Sharifi和Marco Tagliasacchi
已发布
2024年10月30日
作者
ZalánBorsos,Matt Sharifi和Marco Tagliasacchi

我们开创性的语音生成技术正在帮助世界各地的人们与更自然,对话和直观的数字助手和AI工具互动。

言语是人类联系的核心。它可以帮助世界各地的人们交流信息和思想,表达情感并建立相互理解。随着我们旨在生成自然,动态声音的技术不断改善,我们正在释放更丰富,更具吸引力的数字体验。

在过去的几年中,我们一直在推动音频生成的前沿,开发了可以从一系列输入中创建高质量,自然语音的模型,例如文本,节奏控制和特定的声音。该技术在许多Google产品和实验中为单言音频提供了动力,包括Gemini Live,Project Astra,Journey Voices和YouTube的自动配音 - 并正在帮助世界各地的人们与更自然,对话和直觉的数字助手和AI工具进行互动。

gemini live Project Astra 旅程声音 YouTube的自动配音

与Google的合作伙伴一起工作,我们最近帮助开发了两个新功能,这些功能可以生成长格式的多扬声器对话,以使复杂的内容更易于访问:

    Notebooklm音频概述将上传的文档变成引人入胜且活泼的对话。一键单击,两个AI主机总结了用户资料,在来回的主题和开玩笑之间建立联系。Illuminate创建了有关研究论文的正式AI生成的讨论,以帮助使知识更易于访问和消化。
  • Notebooklm音频概述将上传的文档变成引人入胜且活泼的对话。一键单击,两个AI主机汇总了用户材料,在来回的主题和开玩笑之间建立连接。
  • Notebooklm音频概述 照明