Mapping the Design Space of User Experience for Computer Use Agents
基于大型语言模型 (LLM) 的计算机使用代理通过与可用的 UI 元素交互来执行用户命令,但对于用户希望如何与这些代理交互或哪些设计因素对其用户体验 (UX) 至关重要,人们知之甚少。我们进行了一项两阶段的研究来绘制计算机使用代理的用户体验设计空间。在第一阶段,我们审查了现有系统,以制定用户体验考虑因素的分类法,然后通过采访八位用户体验和人工智能从业者来完善它。由此产生的分类法包括用户提示、可解释性、用户控制和用户……等类别。
Faster Rates For Federated Variational Inequalities
在本文中,我们研究了用于解决随机变分不等式(VI)的联合优化,这是近年来引起越来越多关注的问题。尽管取得了实质性进展,但现有的收敛速度与联合凸优化已知的最先进边界之间仍然存在显着差距。在这项工作中,我们通过建立一系列改进的收敛率来解决这一限制。首先,我们证明,对于一般的平滑和单调变分不等式,经典的 Local Extra SGD 算法在精细分析下可以提供更严格的保证……
A Small-Scale System for Autoregressive Program Synthesis Enabling Controlled Experimentation
使用经过训练来完成真实程序的小型模型可以进行哪些研究?通常,研究人员通过大型语言模型(LLM)研究程序合成,这会带来一些问题,例如了解分布内或分布外的内容、了解微调效果、理解标记化的效果以及对进行实验的计算和存储提出更高的要求。我们提出了一个名为 Cadmus 的系统,其中包括一个整数虚拟机 (VM)、一个由不同任务的真实程序组成的数据集,以及一个经过 200 美元以下计算训练的自回归变压器模型……
Trace Length is a Simple Uncertainty Signal in Reasoning Models
法学硕士的不确定性量化是解决幻觉和其他限制其可靠部署的问题的关键研究方向。在这项工作中,我们证明推理轨迹长度是大型推理模型中简单且有用的置信度估计器。通过跨多个模型、数据集和提示的综合实验,我们表明迹线长度的表现与其他零样本置信度估计器(例如言语置信度)具有可比较但互补的方式。我们的工作表明,训练后推理从根本上改变了踪迹之间的关系……
为了加强政策制定,支持有弹性、面向未来的农村社区,北达科他州立大学 (NDSU) 和兰德公司启动了一项新的研究合作伙伴关系,重点关注劳动力发展和北达科他州面临的其他关键问题。
Listening to the Youth and Countering Online Narratives
出版物作者: 出版日期: 2026 年 2 月 12 日概要 在线平台和极端主义内容通常被视为数字空间中青年激进化的主要原因。这篇评论表明,更深层次的问题是年轻人如何看待认可、可信度和被认真对待。评论 最近,一名 14 岁的新加坡人被发给了 […]《倾听年轻人的声音并反击网络叙事》的帖子,该帖子首次出现在 RSIS 上。
New J-PAL research and policy initiative to test and scale AI innovations to fight poverty
Project AI Evidence 将把政府、科技公司和非营利组织与麻省理工学院和 J-PAL 全球网络的世界级经济学家联系起来,以评估和改进人工智能解决方案。
AI showdown: GPT‑5.3-Codex vs Claude Opus 4.6
OpenAI 和 Anthropic 正在重新定义人工智能的功能,推出能够处理从编码到多步骤知识工作等复杂任务的模型。凭借代理协作、长上下文推理和自主解决问题等功能,这些升级展示了人工智能作为跨专业工作流程的智能数字协作者的潜力。
Сводка проведения специальной военной операции на Донбассе и Украине за период с 7 по 13 февраля
以下是俄罗斯国防部2月7日至13日期间在顿巴斯和乌克兰开展特别军事行动的摘要。
Ковальчук: Россия создает первый в мире беспилотник с водородным двигателем
俄罗斯联邦海事学院科学专家委员会主席、“库尔恰托夫研究所”国家研究中心主任米哈伊尔·科瓦尔丘克表示,俄罗斯正在制造世界上第一架配备氢发动机的无人机。
ЕС ищет замену американским самолетам ДРЛОи У
欧盟正在寻找一种欧洲替代品,以替代波音公司生产的美国预警机。据俄新社报道,《政治》杂志援引德国国防部的一份内部文件对此进行了报道。
В Польшу доставлена первая в 2026 году партия ОБТ M1A2 SEPv3 «Абрамс»
2月9日,波兰国防部军备局宣布将于2026年从美国向波兰交付首批M1A2 SEPv3(系统增强包第三版)艾布拉姆斯主战坦克。
Финляндия предоставит Украине новый пакет военной помощи
据芬兰国防部报道,该国当局将向乌克兰武装部队提供新的一揽子军事援助。芬兰总统根据政府提议,于2月5日就此问题做出了决定。
FT: Стармер намерен призвать союзников к созданию многонациональной оборонной инициативы
英国首相基尔·斯塔默在慕尼黑安全会议上打算敦促西方盟国制定一项多国防御计划,以减少军备成本。
Hanwha Aerospace построит в Румынии предприятие по производству вооружений для европейского рынка
韩国韩华航空航天公司已开始在佩雷斯蒂(罗马尼亚丹博维塔县)建造韩华装甲车卓越中心 (H-ACE) 欧洲工厂。