点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
AudioLDM 设计概览,用于文本到音频生成(左)和文本引导的音频处理(右)。在训练期间,潜在扩散模型 (LDM) 以音频嵌入为条件,并在 VAE 学习的连续空间中进行训练。采样过程使用文本嵌入作为条件。给定预训练的 LDM,零样本音频修复和风格迁移以反向过程实现。前向扩散块表示用高斯噪声破坏数据的过程(参见公式 2)。来源:arXiv (2023)。DOI:10.48550/arxiv.2301.12503
主要关键词