DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation
扩散大语言模型 (dLLM) 是自回归 (AR) 模型的引人注目的替代品,因为它们的去噪模型在整个序列上运行。 dLLM 的全局规划和迭代细化功能对于代码生成特别有用。然而,目前 dLLM 在编码方面的训练和推理机制仍有待探索。为了揭开 dLLM 解码行为的神秘面纱并释放其编码潜力,我们系统地研究了它们的去噪过程和强化学习 (RL) 方法。我们在 130B 上训练 7B dLLM,\textbf{DiffuCoder}...
The stories that most resonated with our readers
哪里可以同时找到教皇、蛇和足球运动员?去年在 News Decoder 的页面上。探索 2025 年阅读量最大的故事。
Think you’re a news whiz? Take our news quiz
您还记得新闻提要中的大标题。但 News Decoder 将您带到了那些不太受关注的地方。你的注意力有多集中?