FS-DFM: Fast and Accurate Long Text Generation with Few-Step Diffusion Language Models
自回归语言模型 (ARM) 提供了很强的可能性,但本质上是串行的:它们每次前向传递生成一个令牌,这限制了吞吐量并增加了长序列的延迟。扩散语言模型 (DLM) 跨位置并行,因此对于语言生成来说似乎很有前景,但标准离散扩散通常需要数百到数千次模型评估才能达到高质量,以串行深度换取迭代广度。我们引入 FS-DFM,即少步离散流匹配。离散流量匹配模型,专为提高速度而设计,且不牺牲……