MusicLM 和 AudioLM Google 的文本转音乐和音频工具

为什么重要:MusicLM 和 AudioLM 是 Google 的文本转音乐和文本转音频工具。MusicLM 是 AudioLM 的升级版。

来源:人工智能+

简介

简介

MusicLM 和 AudioLM 是 Google 正在开发的两款下一代产品,一款是文本转音乐,另一款是文本转音频。以搜索引擎闻名的科技巨头 Google 的研究人员宣布了一种新的生成式 Google AI 模型,称为 MusicLM,也称为文本转音乐生成器,可以根据文本描述生成音乐,例如“由失真的小提琴伴奏的舒缓钢琴”。这是对之前称为 AudioLM 的 AI 模型的升级,它还可以将哼唱的旋律转换为不同的音乐风格并输出几分钟的音乐。

生成逼真的音频需要对以不同尺度表示的信息进行建模。例如,就像音乐从单个音符构建复杂的乐句一样,语音将时间局部结构(例如音素或音节)组合成单词和句子。截至目前,MusicLM 和 AudioLM 尚未向公众开放,但在本文中我们将讨论它们两个以及它们的工作原理。

另请阅读:AI 从音频波形数据生成音乐

另请阅读:AI 从音频波形数据生成音乐 另请阅读:AI 从音频波形数据生成音乐 AI 从音频波形数据生成音乐

什么是 MusicLM

什么是 MusicLM

Google 研究人员开发了一种 AI,它可以根据文本提示生成长达数分钟的音乐作品,甚至可以将吹口哨或哼唱的旋律转换为其他乐器。它是使用超过 280,000 小时音乐的数据集进行训练的。这种 AI 被称为 MusicLM。但是,MusicLM 只能以音乐的形式回答您的查询。Google MusicLM 可以根据基于文本的查询立即创建音乐。更有趣的是,AI 甚至可以读取图像及其描述,以创建与图片同步的音乐。

另请阅读:使用生成式 AI 重新定义艺术

另请阅读:使用生成式 AI 重新定义艺术 另请阅读:使用生成式 AI 重新定义艺术 使用生成式 AI 重新定义艺术

什么是 AudioLM

什么是 AudioLM AudioLM 网站