Loading...
机构名称:
¥ 2.0

生成模型近年来因其在需要估算和采样数据分布以生成高保真综合数据的任务方面取得了巨大成功而引起了越来越多的关注。在语音,文本到语音综合和神经声码器中是生成模型的好例子。虽然生成模型已应用于语音中的不同应用,但没有直接模拟语音的通用生成模型。在这项工作中,我们通过显示单个预训练的属性模型来朝着这个方向迈出了一步,可以适应具有很强性能的不同下游任务。具体来说,我们预先训练了一个名为SpeechFlow的生成模型,该模型在60k小时的未转录语音和流量匹配和蒙版条件下进行了预先培训。实验结果表明,预先训练的生成模型可以通过特定于任务的数据进行微调,以匹配或超过有关语音增强,分离和合成的现有专家模型。我们的工作建议使用生成的预培训来构建语音生成任务的基础模型。可以在https://voicebox.metademolab.com/speechflow.html上找到音频样本。

与流量匹配的语音培训的生成预训练

与流量匹配的语音培训的生成预训练PDF文件第1页

与流量匹配的语音培训的生成预训练PDF文件第2页

与流量匹配的语音培训的生成预训练PDF文件第3页

与流量匹配的语音培训的生成预训练PDF文件第4页

与流量匹配的语音培训的生成预训练PDF文件第5页

相关文件推荐

2024 年
¥2.0
2024 年
¥2.0
2020 年
¥1.0
2024 年
¥2.0
2021 年
¥21.0