详细内容或原文请订阅后点击阅览
AI 音乐一代通过 Google 的 MusicFX DJ 走向消费者
Google 的 MusicFX DJ 将 AI 音乐生成转变为一种交互式、消费者友好的体验,根据文本提示创建实时音乐。
来源:KDnuggets简介
多年来,人工智能音乐生成是一个复杂的研究领域,仅限于论文和原型。如今,这项技术已成为消费者关注的焦点。引领这一趋势的是 Google 的 MusicFX DJ,这是一款基于网络的应用程序,可将文本提示实时转换为连续、可控的音乐流。在本文中,我们从技术角度审视 MusicFX DJ,探讨其面向用户的功能、为其提供支持的技术以及其增长对数据科学领域的意义。
什么是 MusicFX DJ?
MusicFX DJ 是一款实验性的、基于网络的应用程序,由 Google DeepMind 与 Google Labs 合作开发。它代表了从单输出人工智能音乐发生器到交互式、以性能为导向的体验的重大转变。该工具的设计易于使用,不需要任何音乐理论知识或数字音频工作站 (DAW) 专业知识。
从本质上讲,MusicFX DJ 的功能就像一个生成式混音台。用户可以输入多个文本提示,例如“时髦的贝斯线”、“空灵的合成器垫”和“驱动嘻哈节拍”,并同时将它们分层。该界面为强度、“混乱”和密度等参数提供类似推子的实时控制,允许用户在播放音乐时调整音乐。这种实时交互性和高质量的 48 kHz 立体声输出使其有别于早期的静态生成工具。
节拍背后的技术:Lyria 和实时扩散
虽然 Google 尚未发布有关 MusicFX DJ 特定型号的完整白皮书,但众所周知,它由 Lyria 系列型号(特别是 Lyria RealTime)提供支持。了解 Lyria 是了解该工具功能的关键。
Lyria 是 Google DeepMind 最先进的音乐生成模型。它建立在扩散模型的基础上,该模型已成为高保真音频和图像生成的主要模型。以下是该技术在 MusicFX DJ 中如何工作的简化分解:
