Loading...
机构名称:
¥ 1.0

自动生成与任意输入音轨适当匹配的音乐是一项具有挑战性的任务。我们提出了一种新颖的可控系统,用于生成单个词干以伴随任意长度的音乐混音。我们方法的核心是音频自动编码器,它可以有效地将音频波形样本压缩为可逆的潜在表示,以及一个条件潜在扩散模型,该模型将混音的潜在编码作为输入并生成相应词干的潜在编码。为了控制生成样本的音色,我们引入了一种技术,在扩散采样期间将潜在空间固定在用户提供的参考风格上。为了进一步提高音频质量,我们采用无分类器引导,以避免在生成无界潜在空间时在高引导强度下出现失真。我们在混音对和匹配低音词干的数据集上训练我们的模型。定量实验表明,给定输入混音,所提出的系统可以生成具有用户指定音色的低音线。我们的可控条件音频生成框架代表着在创建生成性人工智能工具以协助音乐家进行音乐创作方面迈出了重要一步。

通过潜在扩散生成低音伴奏

通过潜在扩散生成低音伴奏PDF文件第1页

通过潜在扩散生成低音伴奏PDF文件第2页

通过潜在扩散生成低音伴奏PDF文件第3页

通过潜在扩散生成低音伴奏PDF文件第4页

通过潜在扩散生成低音伴奏PDF文件第5页

相关文件推荐

2024 年
¥1.0
2024 年
¥1.0
2024 年
¥2.0
2024 年
¥8.0
2022 年
¥1.0
2024 年
¥2.0
2024 年
¥1.0