详细内容或原文请订阅后点击阅览
无
目前,LingBot-VLA已成功适配Galaxea Dynamics、AgileX Robotics等领先厂商的机器人,在不同机器人平台上展现出强大的跨形态迁移能力。
来源:RoboticsTomorrow News目前,LingBot-VLA已成功适配Galaxea Dynamics、AgileX Robotics等领先厂商的机器人,在不同机器人平台上展现出强大的跨形态迁移能力。
蚂蚁集团旗下实体人工智能公司 Robbyant 今天宣布开源版 LingBot-VLA,这是一种视觉-语言-动作 (VLA) 模型,旨在充当现实世界机器人的“通用大脑”,有助于降低训练后成本并加快可扩展部署的速度。
该模型的性能基于 GM-100 基准进行评估,GM-100 是上海交通大学开源的综合评估套件,包含 100 个实际任务。在三个不同的物理机器人平台上进行的测试中,LingBot-VLA 比其他评估模型取得了更高的任务成功率。值得注意的是,当包含深度信息时,模型的空间感知显着改善,创下了任务成功率的新记录。
此外,在 RoboTwin 2.0 模拟基准测试中,LingBot-VLA 在强烈的环境随机化下完成了 50 个具有挑战性的任务,包括变化的光照、杂波和高度扰动,LingBot-VLA 利用其可学习的查询对齐机制有效地集成深度线索,并在复杂场景中实现了更高的任务成功率,在模拟和实际部署上都展示了强大的性能。
迄今为止,由于机器人形态、任务定义和操作环境的差异,跨平台泛化挑战阻碍了嵌入式人工智能的部署。开发人员常常被迫为每个新部署重复收集数据、重新训练模型和微调参数,从而导致成本高、可重用性低和可扩展性有限。
了解更多关于LingBot-VLA的信息,请访问:
代码:https://github.com/Robbyant/lingbot-vla
技术报告:https://arxiv.org/abs/2601.18692
关于 Robbyant
