获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
摘要:由于阻塞和复杂的物体排列,机器人抓握在混乱的环境中仍然是一个重要的挑战。我们开发了ThinkGrasp,这是一种插件的视觉语言握把系统,它利用GPT-4O的高级上下文推理来实现沉重的混乱环境抓地策略。thinkGrasp可以通过使用面向目标的语言来指导去除阻塞物体的障碍物,可以有效地识别和产生目标对象的掌握姿势。这种方法可以从中揭示目标对象,并最终以几个步骤和高成功率掌握了目标对象。在模拟和真实的实验中,ThinkGrasp在沉重的混乱环境中或具有多种看不见的物体中取得了很高的成功率,并且表现出强大的概括能力。