详细内容或原文请订阅后点击阅览
Nvidia 推出了用于创建音乐和音频内容的 AI 模型
Fugatto 技术使您能够感知语音和其他声音并对其进行修改。
来源:OSP网站大数据新闻Nvidia 展示了一种新的人工智能模型,用于创建可以改变声音并生成新声音的音乐和音频内容。这项新技术主要面向音乐、电影和视频游戏的制作人。该公司不打算在不久的将来公开分发 Fugatto 技术(Foundation Generative Audio Transformer Opus 1)。新模型结合了初创公司(尤其是 Runway)和大型企业(Metal Platforms)开发的一系列技术,允许根据文本查询生成音频和视频。它与其他人工智能技术的区别在于它能够感知和修改现有的声音。例如,钢琴上演奏的音乐序列可以转换为人类的歌唱,录制的单词和短语可以改变其重点和情绪基调。
感谢过去 50 年的计算机和合成器,今天的音乐听起来有所不同。生成式人工智能在这里开辟了更多机会。
新模型是根据从开源获得的数据开发的,但 Nvidia 尚未决定是否公开分发。任何生成技术总是带有一定的风险,因为它可以被用来做其创造者反对的事情,例如虚假信息或复制受版权保护的角色。 OpenAI 和 Meta(该公司被认为是极端分子,在俄罗斯被禁止。-编辑)也尚未宣布生成音频或视频的模型的发布日期。
注意编辑