嵌入式人工智能的数据收集:2026 年远程操作、模拟到真实和工业数据集

Embodied AI数据收集指南,涵盖2026年的远程操作、模拟到真实的传输、机器人数据集和工厂OEM数据策略。Embodied AI的数据收集:2026年的远程操作、模拟到现实和工业数据集首次出现在EVST。

来源:EVS Robot 博客

最后更新时间:2026 年 4 月 23 日

嵌入式人工智能的数据收集:2026 年远程操作、模拟到真实和工业数据集

数据是具体人工智能的瓶颈,而不是计算。训练机器人策略需要同步的动作状态流,而这在互联网规模上根本不存在。目前三个来源满足了这一需求。人工远程操作以牺牲操作员时间为代价来产生高质量的演示。模拟到真实的传输可扩展剧集数量,但会带来保真度差距。大型开放数据集汇集了数十个实验室和平台的贡献。

为什么数据是人工智能的具体瓶颈

计算遵循可预测的缩放曲线。如今,能够训练十亿参数视觉语言动作 (VLA) 模型的 GPU 集群已在商业上可用。尚未扩展的是这些模型所需的数据:在物理机器人操作过程中记录的配对观察和动作,以及足够的任务和实施例多样性来产生泛化策略。

语言模型可以在几周内从网络获取一万亿个代币。机器人操作数据集必须逐个生成,每个数据集都需要一个物理机器人、一个真实或模拟的环境、一个任务定义以及一个人类操作员或脚本演示。国际机器人联合会 (IFR) 估计,到 2024 年,全球将有超过 390 万台工业机器人在运行,但最大的开放操作数据集包含约 100 万个片段。差距并没有很快缩小。

当您考虑实施差距时,挑战会更加复杂:在 6-DoF 单臂机械臂上训练的策略无法干净地转移到双手人形机器人或带手臂的移动底座。每个新的机器人外形都​​有效地重置了数据要求。动作分块方法(其中策略输出多步骤动作序列而不是单个步骤)减少了推理延迟,但并没有减少对多样化训练覆盖范围的需求。

三个主要数据源:优点和局限性

机器人