Loading...
机构名称:
¥ 1.0

摘要 - 它仍然是一个重大的挑战,如何在语音产生中进​​行定量控制语音情感的表现力。在这项工作中,我们提出了一种方法来定量操纵情感的情感,以编辑语音生成。我们应用层次情感分布提取器,即层次结构,可以量化不同粒度水平的情绪强度。层次结构ED随后集成到FastSpeech2框架中,指导模型以在音素,单词和话语水平上学习情感强度。在合成过程中,用户可以手动编辑生成的声音的情感强度。客观和主观评估都证明了拟议网络在细粒度的定量情绪编辑方面的有效性。

语音生成的细粒度定量情绪编辑

语音生成的细粒度定量情绪编辑PDF文件第1页

语音生成的细粒度定量情绪编辑PDF文件第2页

语音生成的细粒度定量情绪编辑PDF文件第3页

语音生成的细粒度定量情绪编辑PDF文件第4页

语音生成的细粒度定量情绪编辑PDF文件第5页

相关文件推荐

2025 年
¥1.0
2022 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2025 年
¥1.0
2024 年
¥1.0
2024 年
¥2.0
2024 年
¥1.0
2006 年
¥1.0
2025 年
¥1.0
2001 年
¥1.0
2022 年
¥1.0