下一代机器人应结合其他领域的想法,例如计算机视觉,自然语言处理,机器学习和许多其他领域,因为封闭环境需要在复杂的真实环境中基于多模式输入来处理复杂的任务。这个研讨会的计划着重于机器人学习的生成模型,该模型在于AI和机器人技术的重要和基本领域。基于学习的机器人技术方法已在各种任务中实现了高成功率和概括能力,例如操纵,导航,大满贯,场景重建,原则和物理建模。但是,机器人学习面临着几个挑战,包括数据收集的昂贵成本以及在不同任务和方案中的可转移性较弱。受到计算机视觉和自然语言处理的重大进展的启发,已经努力将生成模型与机器人学习结合在一起,以应对上述挑战,例如综合高质量数据,并将生成框架纳入表示和政策学习。此外,预先训练的大型语言模型(LLM),视觉语言模型(VLM)和视觉语言 - 行动(VLA)模型适用于各种下游任务,以充分利用丰富的常识知识。这种渐进发展使机器人学习框架可以应用于复杂而多样化的现实世界任务。
主要参考:伴随匹配:具有无内存随机最佳控制的微调流量和扩散生成模型。C. Domingo-Enrich,M。Drozdzal,B。Karrer,R。T。Q. Chen,ICLR2025。https://arxiv.org/abs/2409.08861
