详细内容或原文请订阅后点击阅览
利用生成式人工智能使机器人虚拟训练场多样化
“可操纵场景生成”系统创建厨房、客厅和餐厅等数字场景,工程师可以使用这些场景来模拟大量现实世界的机器人交互和场景。图片来源:生成人工智能图像,由研究人员提供。请在此处查看该图像的动画版本。作者:Alex Shipps 像 ChatGPT 和 Claude 这样的聊天机器人有 [...]
来源:Robohub“可操纵场景生成”系统创建厨房、客厅和餐厅等数字场景,工程师可以使用这些场景来模拟大量现实世界的机器人交互和场景。图片来源:生成人工智能图像,由研究人员提供。请在此处查看该图像的动画版本。
这里作者:亚历克斯·希普斯
像 ChatGPT 和 Claude 这样的聊天机器人在过去三年中的使用量急剧上升,因为它们可以帮助您完成广泛的任务。无论你是在写莎士比亚十四行诗、调试代码,还是需要回答一个晦涩的琐事问题,人工智能系统似乎都能满足你的需求。这种多功能性的来源是什么?互联网上有数十亿甚至数万亿的文本数据点。
不过,这些数据还不足以教会机器人成为有用的家庭或工厂助手。为了了解如何在不同的环境中处理、堆叠和放置各种物体,机器人需要进行演示。您可以将机器人训练数据视为操作视频的集合,引导系统完成任务的每个动作。在真实机器人上收集这些演示非常耗时,而且不完全可重复,因此工程师通过使用人工智能生成模拟(通常不反映现实世界的物理)来创建训练数据,或者从头开始繁琐地手工制作每个数字环境。
可操纵场景生成“我们是第一个将 MCTS 应用于场景生成的人,将场景生成任务构建为一个顺序决策过程,”麻省理工学院电气工程与计算机科学系 (EECS) 博士生 Nicholas Pfaff 说道,他是 CSAIL 研究员,也是介绍这项工作的论文的主要作者。 “随着时间的推移,我们不断在部分场景的基础上进行构建,以生成更好或更理想的场景。因此,MCTS 创建的场景比扩散模型训练的场景更复杂。”
纸张 MiDiffusion DiffuScene 可扩展的 Real2Sim麻省理工学院新闻
