通过潜在扩散生成低音伴奏___XiaoMi-AI 助力科研平台

通过潜在扩散生成低音伴奏

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

通过潜在扩散生成低音伴奏

¥ 1.0

热度

自动生成与任意输入音轨适当匹配的音乐是一项具有挑战性的任务。我们提出了一种新颖的可控系统，用于生成单个词干以伴随任意长度的音乐混音。我们方法的核心是音频自动编码器，它可以有效地将音频波形样本压缩为可逆的潜在表示，以及一个条件潜在扩散模型，该模型将混音的潜在编码作为输入并生成相应词干的潜在编码。为了控制生成样本的音色，我们引入了一种技术，在扩散采样期间将潜在空间固定在用户提供的参考风格上。为了进一步提高音频质量，我们采用无分类器引导，以避免在生成无界潜在空间时在高引导强度下出现失真。我们在混音对和匹配低音词干的数据集上训练我们的模型。定量实验表明，给定输入混音，所提出的系统可以生成具有用户指定音色的低音线。我们的可控条件音频生成框架代表着在创建生成性人工智能工具以协助音乐家进行音乐创作方面迈出了重要一步。

添加pdf代下载 VIP点击下载文件