点击购买,资源将自动在新窗口打开.
获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
摘要 - 它仍然是一个重大的挑战,如何在语音产生中进行定量控制语音情感的表现力。在这项工作中,我们提出了一种方法来定量操纵情感的情感,以编辑语音生成。我们应用层次情感分布提取器,即层次结构,可以量化不同粒度水平的情绪强度。层次结构ED随后集成到FastSpeech2框架中,指导模型以在音素,单词和话语水平上学习情感强度。在合成过程中,用户可以手动编辑生成的声音的情感强度。客观和主观评估都证明了拟议网络在细粒度的定量情绪编辑方面的有效性。
主要关键词