摘要 - 诸如Chatgpt之类的基础模型由于其对现实世界的普遍代表而在机器人任务中取得了长足的进步。在本文中,我们利用基本模型来解决Grasp检测,这是具有广泛工业应用机器人技术的持续挑战。尽管数据集很多,但与现实世界数字相比,它们的对象多样性仍然有限。幸运的是,基础模型具有广泛的现实知识存储库,包括我们在日常生活中遇到的对象。因此,对以前的GRASP数据集中有限表示的有希望的解决方案是利用这些基础模型中嵌入的通用知识。我们提出了Grasp-noth,这是一种从基础模型中合成的新的大规模掌握数据集来实施该解决方案。掌握在多样性和幅度上都擅长,具有文本描述和超过3M对象的1M样品,超过了先前的数据集。从经验上讲,我们表明,任何东西都成功地促进了对基于视觉的任务和现实世界机器人实验的零射击抓手的检测。我们的数据集和代码可在https://airvlab.github.io/grasp-anything/上找到。
主要关键词