Mapping the Design Space of User Experience for Computer Use Agents
基于大型语言模型 (LLM) 的计算机使用代理通过与可用的 UI 元素交互来执行用户命令,但对于用户希望如何与这些代理交互或哪些设计因素对其用户体验 (UX) 至关重要,人们知之甚少。我们进行了一项两阶段的研究来绘制计算机使用代理的用户体验设计空间。在第一阶段,我们审查了现有系统,以制定用户体验考虑因素的分类法,然后通过采访八位用户体验和人工智能从业者来完善它。由此产生的分类法包括用户提示、可解释性、用户控制和用户……等类别。
Faster Rates For Federated Variational Inequalities
在本文中,我们研究了用于解决随机变分不等式(VI)的联合优化,这是近年来引起越来越多关注的问题。尽管取得了实质性进展,但现有的收敛速度与联合凸优化已知的最先进边界之间仍然存在显着差距。在这项工作中,我们通过建立一系列改进的收敛率来解决这一限制。首先,我们证明,对于一般的平滑和单调变分不等式,经典的 Local Extra SGD 算法在精细分析下可以提供更严格的保证……
Trace Length is a Simple Uncertainty Signal in Reasoning Models
法学硕士的不确定性量化是解决幻觉和其他限制其可靠部署的问题的关键研究方向。在这项工作中,我们证明推理轨迹长度是大型推理模型中简单且有用的置信度估计器。通过跨多个模型、数据集和提示的综合实验,我们表明迹线长度的表现与其他零样本置信度估计器(例如言语置信度)具有可比较但互补的方式。我们的工作表明,训练后推理从根本上改变了踪迹之间的关系……
New J-PAL research and policy initiative to test and scale AI innovations to fight poverty
Project AI Evidence 将把政府、科技公司和非营利组织与麻省理工学院和 J-PAL 全球网络的世界级经济学家联系起来,以评估和改进人工智能解决方案。
ЕС ищет замену американским самолетам ДРЛОи У
欧盟正在寻找一种欧洲替代品,以替代波音公司生产的美国预警机。据俄新社报道,《政治》杂志援引德国国防部的一份内部文件对此进行了报道。
В Польшу доставлена первая в 2026 году партия ОБТ M1A2 SEPv3 «Абрамс»
2月9日,波兰国防部军备局宣布将于2026年从美国向波兰交付首批M1A2 SEPv3(系统增强包第三版)艾布拉姆斯主战坦克。
More Than 1,000 AI Bills Later, Here’s What States Are Actually Doing With Artificial Intelligence
目前,各州似乎正在谨慎行事,针对明显的问题,并向选民发出关注的信号,但又不会过度承诺他们可能很快就会后悔的规则。随着人工智能能力和政治压力的持续增长,这种平衡是否成立仍然是一个悬而未决的问题。《超过 1,000 个人工智能法案之后,以下是各州实际上在人工智能方面所做的事情》一文首先出现在美国企业研究所 - AEI 上。
The Congressional Budget Office’s Updated Projections
由于特朗普政府隐瞒了其预算前景的关键细节,因此很难追踪过去一年推出的一系列支出和税收政策变化的累积影响。因此,国会预算办公室最近的基线更新对现状进行了令人欢迎的澄清,尽管它具有异常程度的不确定性。国会预算办公室的更新预测帖子首先出现在美国企业研究所 - AEI 上。
How Regulation Helped Break US Homebuilding
对于美国的住房负担能力问题,有各种各样所谓的恶棍。但许多通常的嫌疑人可能是无辜的。最大的误区之一是大型机构投资者应该受到指责。《监管如何帮助打破美国住宅建设》一文首先出现在美国企业研究所 - AEI 上。
Chatrie v. United States and You
您可能听说最高法院已同意审理一个有趣的第四修正案案件。 Chatrie v. United States 将审查地理围栏搜查令的执行是否违法。将第四修正案应用于地理围栏等新技术(无论这些技术是什么)当然很有趣。它与你的关系比你想象的要大。查特里诉美国和你的帖子首先出现在美国企业研究所 - AEI 上。
Trump Houses Are a Good Idea—If
面对公众对高房价的担忧,特朗普政府正在考虑“特朗普之家”的想法,即私人建造入门住宅,但得到某种联邦政府的支持,以鼓励私人投资者。特朗普的房子是个好主意——如果首先出现在美国企业研究所 - AEI 上。
Конструктору биатлонных винтовок Владимиру Суслопарову — 80 лет
在他的参与下,冬季两项 7-3 和冬季两项 7-4 步枪、一系列狩猎卡宾枪、SV-99 狙击步枪和其他武器被创建
Erin Moore 博士是俄亥俄州立大学人类学系人类学和医学史助理教授 Carl F. Asseff 博士,是一位社会文化和医学人类学家......
Fort Benning integrates virtual drone training into OSUT program of instruction
佐治亚州本宁堡 — 随着小型无人机系统 (sUAS) 成为现代战场的一个决定性特征,卓越机动中心正在...
Blast from the past: Omaha District supports emergency response in Blizzard of 1949
1948-49 年的冬天带来了一系列强烈的风暴,覆盖了内布拉斯加州、怀俄明州和达科他州的大部分地区,大雪、极度寒冷和寒冷......
Army Still Years Away From Large-Scale Autonomous Ground Vehicle Ops
陆军开发和部署能够执行一系列战场任务的无人地面车辆的努力已经进行了 20 多年。但开发自主软件和车辆技术的研究人员和公司将生产安全、有效和致命的机器人地面战车,他们表明,尽管五角大楼敦促加快进展,大规模自主行动至少还需要十年的时间。
317th AW leads Spring 2026 C-130 WSC, integrates with I MEF
第 317 空运联队于 2026 年 2 月 4 日至 5 日在加利福尼亚州彭德尔顿海军陆战队基地举行了 2026 年春季 C-130 武器系统委员会 (WSC),与海军陆战队第一远征军协调,进一步整合快速空中机动概念并加强整个联合部队和总部队的联合战术空运能力。
How can West Africa strengthen its collective security against violent extremism?
西非如何加强集体安全,打击暴力极端主义? 2026 年 3 月 9 日 — 下午 4:30 至下午 5:45 匿名(未核实)2026 年 2 月 13 日 查塔姆研究所和在线 加入我们在查塔姆研究所,尼日利亚、加纳和塞拉利昂外交部长探讨重建萨赫勒地区秩序和安全的战略。在这次活动中,尼日利亚、加纳和塞拉利昂外交部长将审查能够解决日益不安全的根本原因的战略。他们还将考虑双边关系的方针和重振西非区域主义的实际选择,包括在严重危机时期恢复信任与合作的机制。从乍得湖流域到马里西部,西非的不安全局势具有深刻的跨国性。然而,近期萨赫勒中部政变浪潮引发的地区政治分裂,破坏了有效的跨境安全合作。随着萨赫勒五国集