Loading...
机构名称:
¥ 1.0

在各种声学环境中,在各种声音环境中实现强大的语音分离,并带来了一个开放的挑战。尽管现有的数据集可用于训练分离器以获取特定方案,但它们并未在各种现实世界中概括地概括。在本文中,我们提出了一条新型的数据模拟管道,该管道从一系列声学环境和内容中产生各种培训数据,并提出了新的培训范式,以提高一般语音分离模型的质量。具体来说,我们首先引入AC-SIM,AC-SIM是一种数据模拟管道,该管道结合了内容和声学的广泛变化。然后,我们将多个培训目标纳入置换不变训练(PIT),以增强训练有素的模型的分离质量和概括。最后,我们在分离界和基准之间进行了全面的观察和人类听力实验,以验证我们的方法,从而对非同源和现实世界测试集进行了实质性改进。索引术语:语音分离,数据模拟,多损失优化

改善现实中语音分离的概括 -

改善现实中语音分离的概括 -PDF文件第1页

改善现实中语音分离的概括 -PDF文件第2页

改善现实中语音分离的概括 -PDF文件第3页

改善现实中语音分离的概括 -PDF文件第4页

改善现实中语音分离的概括 -PDF文件第5页