增益关键词检索结果

支持自由贸易论点的有缺陷的福利基础

The Flawed Welfare Foundations of Pro-Free Trade Arguments

Mark Glick 和 Gabriel A. Lozada 在这篇 INET 论文中质疑自由贸易的经济学:长期以来,自由贸易一直被认为是经济学中无可争议的好处,但其福利基础存在严重缺陷。比较优势强调的效率增益取决于潜在帕累托原则,该原则假设消除了分配问题并对待[...]

使用 SWE-Gym 培训软件工程代理和验证员

Training Software Engineering Agents and Verifiers with SWE-Gym

我们推出了 SWE-Gym,这是第一个用于培训现实世界软件工程 (SWE) 代理的环境。 SWE-Gym 包含 2,438 个真实的 Python 任务实例,每个实例都包含一个具有可执行运行时环境、单元测试和以自然语言指定的任务的代码库。我们使用 SWE-Gym 来训练基于语言模型的 SWE 代理,在流行的 SWE-Bench Verified 和 Lite 测试集上实现了高达 19% 的解决率绝对增益。我们还通过在 SWE-Gym 采样的代理轨迹上训练的验证器来实验推理时间缩放。与我们经过微调的 SWE 结合使用...