使用基于扩散的生成模型
机构名称:
¥ 1.0

最近,基于条件分数的扩散模型在监督语音增强领域引起了人们的关注,从而产生了最新的性能。但是,这些方法在普遍到看不见的条件时可能会面临挑战。为了解决这个问题,我们引入了一种以无监督方式运行的替代方法,利用了扩散模型的生成力量。具体来说,在训练阶段,使用基于得分的扩散模型在短期傅立叶变换(STFT)域中学习了清晰的语音,从而使其无条件地从高斯噪声中产生干净的语音。然后,我们通过与语音信号推理的噪声模型相结合,开发了一种后验采样方法来增强语音的增强。通过迭代期望最大化(EM)方法同时学习噪声参数以及干净的语音估计。据我们所知,这是探索基于扩散的生成模型的第一部作品,用于无监督语音增强,与最近的变异自动编码器(VAE)基于无监督的方法和一种最先进的基于扩散的基于扩散的超级访问方法相比,这表明了有希望的恢复。因此,它在无监督的语音增强中为未来的研究打开了一个新的方向。

使用基于扩散的生成模型

使用基于扩散的生成模型PDF文件第1页

使用基于扩散的生成模型PDF文件第2页

使用基于扩散的生成模型PDF文件第3页

使用基于扩散的生成模型PDF文件第4页

使用基于扩散的生成模型PDF文件第5页