DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation
扩散大语言模型 (dLLM) 是自回归 (AR) 模型的引人注目的替代品,因为它们的去噪模型在整个序列上运行。 dLLM 的全局规划和迭代细化功能对于代码生成特别有用。然而,目前 dLLM 在编码方面的训练和推理机制仍有待探索。为了揭开 dLLM 解码行为的神秘面纱并释放其编码潜力,我们系统地研究了它们的去噪过程和强化学习 (RL) 方法。我们在 130B 上训练 7B dLLM,\textbf{DiffuCoder}...
IEEE Transactions on Neural Networks and Learning Systems, Volume 37, Issue 2, February 2026
1) 视觉曼巴:全面的调查和分类作者:X. Liu,C. Zhang,F. Huang,S. Xia,G. Wang,L. Zhang 页数:505 - 5252) Hard Sample Mining: A New Paradigm of Efficient and Robust Model Training 作者:L. Liu,Y. Liang,X. Yan,L. Huangfu,S. Samtani,Z. Yu,Y.张,D. D. Zeng页数:526 - 5463) FEU-Diff:用于医学图像分割的模糊证据驱动的动态不确定性融合的扩散模型作者:S. Geng,S. Jiang,T.