NVIDIA 通过自动驾驶汽车、机器人和视觉 AI 的代理技能开启物理 AI 研究的下一个时代 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

NVIDIA 通过自动驾驶汽车、机器人和视觉 AI 的代理技能开启物理 AI 研究的下一个时代

2026年6月3日 15:00 33 Comments

在 CVPR 上，NVIDIA 推出了新的物理 AI 代理技能，可帮助研究人员和开发人员加快自动驾驶车辆、机器人和视觉 AI 系统的开发。物理人工智能研究的核心挑战不仅仅是开发更强大的模型。它正在围绕它们构建完整的工作流程 - 重建现实世界场景、生成边缘情况场景、训练策略、评估 [...]

来源:NVIDIA 博客 _机器人技术

在 CVPR 上，NVIDIA 推出了新的物理 AI 代理技能，可帮助研究人员和开发人员加快自动驾驶车辆、机器人和视觉 AI 系统的开发。

物理人工智能研究的核心挑战不仅仅是开发更强大的模型。它正在围绕它们构建完整的工作流程——重建现实世界场景、生成边缘情况场景、训练策略、评估行为和快速迭代。如今，这些步骤分散在不同的工具中，当研究人员努力将它们拼凑在一起时，实验的速度减慢了。

本周早些时候，NVIDIA 发布了 NVIDIA Cosmos 3，这是物理 AI 的开放前沿模型，也是世界上第一个统一视觉推理、世界和动作生成的完整全模型。世界基础模型在物理 AI 核心的开放模型公共排行榜中处于领先地位，为物理 AI 开发提供了核心功能。NVIDIA 物理 AI 技能与 Cosmos、NVIDIA 库和模拟框架相结合，可帮助研究人员以前所未有的速度从模型功能转向可扩展的端到端工作流程。

推动自动驾驶汽车研究超越记录里程

对于自动驾驶研究人员来说，问题在于驾驶的“长尾”——罕见的交互、不寻常的道路几何形状、照明变化和边缘情况行为，这些难以重复收集，但对于训练和验证至关重要。

OpenClaw 中的神经重建技能演示，展示了从提升的虚拟传感器视角重新渲染的视频。

InstantNuRec 可以从图像中快速重建 3D 高斯道路场景，无需针对每个场景进行优化。

对于 AV 研究人员来说，可重复的模拟有助于改变条件、比较系统响应并揭示超出现实世界数据所能捕获的场景的故障模式。

推进现实世界的视觉人工智能系统

目视检查的新技能会在不同的表面上产生多种罕见的缺陷。

通过代理就绪的模拟工作流程扩展机器人学习

可用性

模拟工作技能几何形状世界的现实实验的人工智能不同的模型可重复的检查的驾驶的核心的强大的目视检查驾驶训练策略系统的流程 NVIDIA 不寻常的自动机器人 Cosmos 视觉开发人员传感器重复的核心功能扩展的故障模式可用性系统响应研究人员端到端场景世界完整的研究的 AI 物理