文本处理领域信息情报检索---XiaoMi-AI

2025年7月10日 06:25

一个改善生成语言模型自然性的变异框架

A Variational Framework for Improving Naturalness in Generative Spoken Language Models

大型语言模型在文本处理中的成功激发了他们对语音建模的适应。但是，由于语音是连续且复杂的，因此通常将其离散为自回归建模。源自自我监督模型（称为语义令牌）的语音令牌通常集中在语言方面，但忽略了韵律信息。结果，对这些代币进行训练的模型可以产生自然性降低的语音。现有方法试图通过在语义令牌中添加音调功能来解决此问题。但是，单独的音高不能完全代表范围…

文本处理关键词检索结果

一个改善生成语言模型自然性的变异框架