DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation
扩散大语言模型 (dLLM) 是自回归 (AR) 模型的引人注目的替代品,因为它们的去噪模型在整个序列上运行。 dLLM 的全局规划和迭代细化功能对于代码生成特别有用。然而,目前 dLLM 在编码方面的训练和推理机制仍有待探索。为了揭开 dLLM 解码行为的神秘面纱并释放其编码潜力,我们系统地研究了它们的去噪过程和强化学习 (RL) 方法。我们在 130B 上训练 7B dLLM,\textbf{DiffuCoder}...
It’s Official: U.S. Military F-35 Getting So Many Upgrades It Will Fly Until 2070s
F-35 围绕“持续现代化”构建,使用迭代软件投放来实现功能的重大跃升,而无需重新设计机身。下一步是 Block 4,这是一项重大升级,旨在扩展传感、瞄准、计算能力和武器集成,使飞机在数十年内保持相关性。 官方帖子:美国军用 F-35 进行如此多的升级,它将飞行到 2070 年代,首先出现在 19FortyFive 上。
The U.S. Air Force’s F-47 NGAD Fighter Has a New Enemy (Not Russia or China)
要点和概要:中国对至少两种下一代战斗机设计(通常被标记为 J-36 和沉阳“J-50/J-XDS”)进行了可见的飞行测试,这加剧了人们对北京迭代速度比美国更快的看法。这些目击事件,再加上有关快速设计变更的报道,提出了一个合理的问题:华盛顿能否推动 NGAD 前进? F-47,[…]美国空军的 F-47 NGAD 战斗机有了新敌人(不是俄罗斯或中国)一文首先出现在 19FortyFive 上。
Keeping the Marine Corps Amphibious
加利福尼亚州彭德尔顿营地 - 本月早些时候,六辆两栖战车穿过清晨平静的海面,驶上海军陆战队基地彭德尔顿营地的红海滩。 ACV 船员与其他几艘海军气垫登陆艇一起从珍珠港号船坞登陆舰 (LSD-52) 运送到离岸几英里的地方。 ACV 和 LCAC 的海滩登陆是“钢铁骑士 25”演习中舰岸一体化和两栖作战的展示。由第一海军陆战师主导的年度活动是驻扎在西海岸的第一海军陆战队远征军的一项关键演习。今年的迭代还包括美国第三舰队
BED-LLM: Intelligent Information Gathering with LLMs and Bayesian Experimental Design
我们提出了一种通用方法,用于提高大型语言模型 (LLM) 使用顺序贝叶斯实验设计 (BED) 框架智能、自适应地从用户或其他外部源收集信息的能力。这使得法学硕士能够充当有效的多轮会话代理并与外部环境进行交互。我们的方法称为 BED-LLM(大型语言模型的贝叶斯实验设计),基于迭代选择问题或查询,最大化关于任务的预期信息增益 (EIG)
OCD25 wraps up: delivering holiday cheer, supplies to Pacific islands
2025 年圣诞空投行动是第 74 次迭代,来自美国、加拿大、日本和韩国的军人聚集在一起,执行战争部持续时间最长的人道主义空运任务。
Score Distillation of Flow Matching Models
扩散模型实现了高质量的图像生成,但受到缓慢的迭代采样的限制。蒸馏方法通过一步或几步生成来缓解这一问题。流匹配最初是作为一个独特的框架引入的,后来被证明在理论上等同于高斯假设下的扩散,这就提出了蒸馏技术(例如分数蒸馏)是否可以直接转移的问题。我们提供了一个简单的推导——基于贝叶斯规则和条件期望——统一了高斯扩散和流量匹配,而不依赖于 ODE/SDE……