Nvidia 推出了用于创建音乐和音频内容的 AI 模型 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

Nvidia 推出了用于创建音乐和音频内容的 AI 模型

2024年12月17日 06:59 33 Comments

Fugatto 技术使您能够感知语音和其他声音并对其进行修改。

来源:OSP网站大数据新闻

Nvidia 展示了一种新的人工智能模型，用于创建可以改变声音并生成新声音的音乐和音频内容。这项新技术主要面向音乐、电影和视频游戏的制作人。该公司不打算在不久的将来公开分发 Fugatto 技术（Foundation Generative Audio Transformer Opus 1）。新模型结合了初创公司（尤其是 Runway）和大型企业（Metal Platforms）开发的一系列技术，允许根据文本查询生成音频和视频。它与其他人工智能技术的区别在于它能够感知和修改现有的声音。例如，钢琴上演奏的音乐序列可以转换为人类的歌唱，录制的单词和短语可以改变其重点和情绪基调。

感谢过去 50 年的计算机和合成器，今天的音乐听起来有所不同。生成式人工智能在这里开辟了更多机会。

新模型是根据从开源获得的数据开发的，但 Nvidia 尚未决定是否公开分发。任何生成技术总是带有一定的风险，因为它可以被用来做其创造者反对的事情，例如虚假信息或复制受版权保护的角色。 OpenAI 和 Meta（该公司被认为是极端分子，在俄罗斯被禁止。-编辑）也尚未宣布生成音频或视频的模型的发布日期。

注意编辑

音乐一系列分发音频 Nvidia 计算机发布日期人工智能生成模型编辑公司技术例如视频创造者改变版权保护声音合成器

Nvidia 推出了用于创建音乐和音频内容的 AI 模型

其他外部链接

Tags

XiaoMi-AI