Loading...
机构名称:
¥ 1.0

自我监督学的模型已被发现对诸如自动语音识别,说话者识别等的任务非常有效。但是,它们在言语增强系统中的效用尚未牢固确立,也许有些误解。在本文中,我们将使用SSL表示在具有挑战性的条件下用于增强单渠道语音的用途,并确定它们对增强任务的影响。我们的约束是围绕实时的实时语音增强设计的 - 模型是因果关系,并且计算足迹很小。此外,我们专注于低SNR条件,在这种情况下,这种模型难以提供良好的性能。索引术语:语音增强,WAV2VEC2,GCRN,预训练,知识蒸馏,调理

更仔细地查看wav2vec2嵌入式的单个嵌入...

更仔细地查看wav2vec2嵌入式的单个嵌入...PDF文件第1页

更仔细地查看wav2vec2嵌入式的单个嵌入...PDF文件第2页

更仔细地查看wav2vec2嵌入式的单个嵌入...PDF文件第3页

更仔细地查看wav2vec2嵌入式的单个嵌入...PDF文件第4页

更仔细地查看wav2vec2嵌入式的单个嵌入...PDF文件第5页