模型的关键词检索结果

特朗普签署行政命令,允许联邦政府自愿审查顶级人工智能模型的国家安全风险

Trump signs executive order that allows voluntary federal vetting of top AI models for national security risks

目前尚不清楚周二签署的命令与他 5 月 21 日拒绝签署的命令有多大不同。

人为错误如何成为对抗大型语言模型的武器

How human error became a weapon against large language models

艾伦·图灵提出了一项机器智能测试:计算机能否让人类相信它是人类? Max Moser 写道,我们已经开始对自己进行同样的测试

AI 模型的信心陷阱

The AI Model Confidence Trap

为什么你的 AI 模型在 99% 的置信度下可能会出错这篇文章《AI 模型置信陷阱》首先出现在《走向数据科学》上。

Heartland Institute 专家对特朗普总统关于联合国退出极端气候模型的社交媒体帖子做出反应

Heartland Institute Experts React to President Trump’s Social Media Post About UN Retreating from Extremist Climate Models

特朗普总统庆祝 RCP 8.5 垮台是绝对正确的。这从来都不是未来的准确模型。 哈特兰研究所专家对特朗普总统关于联合国从极端主义气候模型中撤退的社交媒体帖子的反应首先出现在“Watts Up With That?”上。

VSAS-Bench:视觉流辅助模型的实时评估

VSAS-Bench: Real-Time Evaluation of Visual Streaming Assistant Models

流式视觉语言模型 (VLM) 在给定指令提示和在线输入帧流的情况下不断生成响应。这是实时视觉助手的核心机制。现有的 VLM 框架主要评估离线环境中的模型。相比之下,流式 VLM 的性能取决于纯视频理解之外的其他指标,包括主动性(反映模型响应的及时性)和一致性(反映模型响应随时间的稳健性)。为了解决这个限制,我们提出了 VSAS-Bench,一个新的......

退伍军人事务部:改进监督可以加强医疗保健资金估算流程

Veterans Affairs: Improved Oversight Could Strengthen Processes for Estimating Health Care Funding

GAO 的发现 为了支持每年的医疗保健预算预测,退伍军人健康管理局 (VHA) 与精算顾问签订合同,协助 VHA 进行年度参保医疗保健预测模型更新。该模型产生三个基本输出:入学率、利用率和单位成本。每个输出都经过多次复杂的调整,以考虑 VHA 医疗保健的特征以及获得 VHA 医疗保健服务的退伍军人的特点。 VHA 参保者医疗保健预测模型的基本输出 GAO 发现 VHA 开发模型估计的流程符合大多数但并非所有相关标准。例如,VHA 的招生和预测办公室 (E&F) 没有正式的流程要求 VHA 的精算顾问在初始模型交付后将新出现的数据纳入模型中。据 VHA 官员称,在交付初始模型场景后不需要合并新出

麻省理工学院的研究人员教人工智能模型解释图表

MIT researchers teach AI models to interpret charts

新的 ChartNet 训练数据集可以提高视觉语言模型的准确性,帮助分析业务趋势或解释科学数据。

气候模型“只是物理学”吗?

Are Climate Models “Just Physics”?

...任何政策都只能受益于更好地了解气候模型的构建方式、其物理基础、如何测试以及如何评估其输出。气候模型“只是物理学”吗?首先出现在 Watts Up With That? 上。

生成式人工智能实况调查报告 – 竞争环境中的挑战

生成AIに関する実態調査報告書-競争環境上の課題

■概要 2026年4月16日,公平交易委员会发布了《生成式人工智能实况调查报告2.0版(以下简称报告)》。该报告调查和分析了生成式人工智能的市场,并考虑了反垄断法下的问题。报告称,市场分为三个部分。具体来说,分为三层:基础设施层,提供生成式人工智能模型的构建和运行环境;模型层,构建并提供生成式人工智能模型;应用层,提供生成式人工智能服务。在基础设施层,生成式AI模型开发者可以直接采购半导体,也可以在云端提供模型开发环境。在前一种情况下,NVIDIA作为半导体供应商具有优势。在后者领域,亚马逊、微软和谷歌是三大领先者。在模型层,无论是通用AI模型还是专用模型,拥有丰富计算资源(半导体等)和海量数

理解经济信心模型至关重要

It is CRUCIAL to Understand the Economic Confidence Model

即将举行的 ECM 网络研讨会的时机非常重要。网络研讨会结束后,我们将直接进入一个重要的 ECM 转折点,了解经济信心模型的运作方式对于投资者、交易员、企业主以及任何试图应对全球混乱局面的人来说从未如此重要。 [...]

物理人工智能的未来不是更智能的机器人,而是更智能的界面

The Future of Physical AI Isn’t Smarter Robots, It’s Smarter Interfaces

这篇赞助文章由 Wetour Robotics 为您带来。风力涡轮机上的现场技术人员,夹住安全带,双手握住扳手,需要向挂在腰带上的诊断设备发送命令。装卸码头上的一名物流工人戴着手套,眼睛盯着托盘,需要重新调整连接的电梯的方向。在拥挤的街道上使用辅助移动设备的人希望在不拿出手机或大声说话的情况下推动它前进。这些时刻都不需要更智能的机器人。他们呼吁采用一种更智能的方式来让现有的机器听到声音。该行业一直在从一方面进行建设。过去三年的物理人工智能是循环中机器人方面取得显着进展的故事。 Boston Dynamics、Figure 和 Unitree 等公司拥有先进的执行器、运动和灵巧性,其水平在十年前

多模态评估器:MLLM 作为 Strands Evals 中图像到文本任务的法官

Multimodal evaluators: MLLM-as-a-judge for image-to-text tasks in Strands Evals

如果您正在构建视觉购物、图像或文档理解或图表分析,您需要一种方法来验证模型的响应是否确实基于源图像。纯文本评估器无法告诉您标题是否忠实地描述了图像、提取的发票总额是否与文档匹配、或者屏幕摘要是否[...]

俄罗斯科学家教推荐系统更好地了解用户

Российские ученые научили рекомендательные системы глубже понимать пользователей

俄罗斯储蓄银行实用人工智能中心的科学家与 AIRI 研究所、Innopolis 大学和 ITMO 的研究人员一起,找到了一种将深层语义知识从大型语言模型转移到紧凑推荐系统的方法。对于用户来说,这增加了选择商品、电影和其他内容的准确性,并且不会减慢服务的运行——发布推荐的速度保持在原始轻模型的水平。

《ROBBO》进入俄罗斯儿童系列前三名

«РОББО» вошла в топ-3 детских франшиз России

NTI Circle Movement的成员“ROBBO”在全俄顶级特许经营权评级中排名第19位。国内儿童特许经营中,EdTech公司排名第三。关键的评估标准是现有加盟商的评论和对网络经济模型的分析。

ASRobotics 为 NTI Circles 创建了一个测试场,用于同时测试无人驾驶车辆和直升机

«АСРоботикс» создала для кружков НТИ полигон для одновременного испытания беспилотных авто и коптеров

俄罗斯第一个在城市环境中同时测试无人驾驶车辆和直升机模型的机器人测试场由俄罗斯公司 ASRobotics 开发。该新产品将于2020年4月的NTI圆圈运动奥运会决赛中进行首次测试。在工程竞赛决赛中,学生们将在训练场建模一个“智能”物流中心,用于通过陆路和空中运送货物。

谁将为机器人 Fedor 开发软件?

Кто будет разрабатывать ПО для робота Федора?

FPI 公布了进入基于模拟器环境中的功能 3D 模型的拟人机器人 FEDOR 自主控制软件虚拟开发阶段的参与者名单

机器人机器人在坦波夫发射

В Тамбове запустили робота-дроида

6月底,在德鲁日巴公园茨纳河运河的一处牛弓河中,进行了水上机器人“AquaMorris”(由弗拉基米尔·苏霍鲁科夫设计)的阿尔法模型的测试演习。

天与水之间。第二部分

Между небом и водой. Часть II

壁纸水上飞机的历史、喷气式飞机模型的出现和现代应用