NVIDIA Cosmos 是一个经过 2000 万小时视频训练的大型开源视频世界模型

NVIDIA 推出了新平台 Cosmos,旨在加速自动驾驶汽车和机器人等物理 AI 系统的开发。 Cosmos 包括生成世界模型、高级标记器和针对 NVIDIA 云 GPU 优化的加速视频处理管道。该平台基于数百万小时的驾驶和机器人视频数据进行训练,并根据开放许可提供,以实现 […] NVIDIA Cosmos 的开发民主化,这是一个基于 2000 万小时视频进行训练的大型开源视频世界模型,首次出现在 AI消息。

来源:AI新闻
该平台基于 9000 万亿个 token 进行训练,包括 2000 万小时的机器人和驾驶数据。Cosmos WFM 通过其 tokenizer 提供 8 倍更好的压缩和 12 倍更快的数据处理速度。针对不同的用例,模型的大小从 40 亿到 140 亿个参数不等内置安全功能可过滤不当内容并应用数字水印平台通过 NVIDIA NeMo Curator 将数据管理速度提高 20 倍性能优于基线模型,姿势估计成功率最高提高 14 倍该系统采用开放许可,无需高昂的入门成本即可实现大规模开发NVIDIA 推出了 Cosmos,一个加速自动驾驶汽车和机器人等物理人工智能系统开发的新平台。 Cosmos 包括生成世界模型、高级标记器和针对 NVIDIA 云 GPU 优化的加速视频处理管道。该平台经过数百万小时的驾驶和机器人视频数据训练,并根据开放许可提供,以实现物理 AI 开发的民主化。它将先进的视频模型与物理感知功能和全面的安全机制相结合,以加速物理 AI 系统的开发。采用 Uber、Waabi、Wayve 和 Foretellix 等领先公司已经开始将 Cosmos 用于与自动驾驶汽车和机器人相关的各种应用。可用性 Cosmos WFM 现已在 Hugging Face 和 NVIDIA NGC 目录上提供。它们很快将作为完全优化的 NVIDIA NIM 微服务提供。https://www.nvidia.com/en-us/ai/cosmos
  • 该平台基于 9000 万亿个 token 进行训练,包括 2000 万小时的机器人和驾驶数据
  • Cosmos WFM 通过其标记器提供 8 倍更好的压缩和 12 倍更快的数据处理
  • 这些模型的参数大小从 40 亿到 140 亿不等,适用于不同的应用
  • 该平台通过 NVIDIA NeMo Curator 将数据管理速度提高了 20 倍
  • 宇宙

    采用

    可访问性