Training Software Engineering Agents and Verifiers with SWE-Gym
我们推出了 SWE-Gym,这是第一个用于培训现实世界软件工程 (SWE) 代理的环境。 SWE-Gym 包含 2,438 个真实的 Python 任务实例,每个实例都包含一个具有可执行运行时环境、单元测试和以自然语言指定的任务的代码库。我们使用 SWE-Gym 来训练基于语言模型的 SWE 代理,在流行的 SWE-Bench Verified 和 Lite 测试集上实现了高达 19% 的解决率绝对增益。我们还通过在 SWE-Gym 采样的代理轨迹上训练的验证器来实验推理时间缩放。与我们经过微调的 SWE 结合使用...
How a Gemma model helped discover a new potential cancer therapy pathway
我们正在推出一个新的 270 亿参数基础模型,用于基于 Gemma 系列开放模型构建的单细胞分析。
IEEE Transactions on Evolutionary Computation, Volume 29, Issue 5, October 2025
1) 客座社论进化动态优化作者:Danial Yazdani、罗文建、杨胜翔页数:1458 - 14622) 动态事件如何改变旅行商问题的适应度?作者:佟浩、李米青、刘家林、姚鑫页数:1463 - 14743) 历史 动态多模态优化的信息辅助动态响应集成和自适应利基方法作者:Kunjie Yu, Xuyang Zhang, Dezheng Zhang, Jing Liang, Yumeng Li, Heshan Wang, Ke Chen, Caitong YuePages: 1475 - 14894) 使用进化贪心的动态级联流程车间调度 算法作者:Qiu-Ying Li、Quan-Ke Pa
Agibot Unveils Next-Gen Industrial-Grade Interactive Embodied Robot Agibot G2
它将快速学习和部署能力与多模态语音交互功能相结合,适用于工业生产、物流、导览等多种场景,有望重塑工业级实体机器人的应用格局。
AI could analyse lessons delivered by new teachers under NIOT pilot
在一项正在计划的新试验中,人工智能可用于分析早期职业教师的课程录音人工智能可以分析 NIOT 试点项目下新教师讲授的课程的帖子首次出现在《学校周》上。
Leading the Future Right From the Start: Dell Med Students Publish Pediatric Brain Tumor Research
在神经外科医生兼科学家 Kevin Kumar 的指导下,戴尔医学中心的学生将实践学习应用于转化研究,并发表儿科癌症护理的新观点。从头开始引领未来:戴尔医学中心的学生发表儿科脑肿瘤研究一文首先出现在 UT Austin News - 德克萨斯大学奥斯汀分校。