基金会模型表现出了显着的紧急能力,对构成体现的代理商的推理和计划能力持巨大希望。然而,缺乏用于评估复杂环境中具有多模式观测的体现药物的基准,仍然是一个显着的差距。在本文中,我们提出了MUEP,这是一种用于e mbodied p lanning的全面MU ltimodal基准。MUEP促进了在复杂场景中体现药物的多模式和多转弯相互作用的评估,并结合了精细粒度的评估指标,这些指标可为您在整个任务中提供有关体现剂的性能的见解。此外,我们在拟议的基准上评估了具有最新的基础模型,包括大型语言模型(LLMS)和大型多模型模型(LMMS)。实验结果表明,基于环境的文本代表的基础模型通常超过其视觉效果,这表明具有多模式观察的型号计划能力存在差距。我们还发现,控制语言的生成是不可或缺的能力,超出常识性知识,无法进行准确的体现任务完成。我们希望拟议的MUEP基准可以为体现AI的进步与基础模型的发展。
简介 在 2023 年春季学期,亚利桑那州立大学地理科学与城市规划学院 (SGSUP) 城市与环境规划硕士 (MUEP) 课程规划研讨会的研究生与凤凰城 (AZ) 合作,解决一个现实世界的规划项目。该课程满足了 SGSUP 的要求,即二年级 MUEP 学生完成一个最终项目,让学生沉浸在与客户一起进行的综合学术和专业规划体验中。青年的声音在长期城市规划中经常被忽视,但这些人既是这些城市的居民,也将继承这些城市。青年参与是凤凰城公共宣传计划的重要组成部分,旨在传达其未来愿景。凤凰城与亚利桑那州立大学 MUEP 项目的研究生合作,与年轻居民互动并记录他们对城市未来的偏好。凤凰城市长和市议会选择了十所学校参与这项青年参与活动。通过在这些学校举办研讨会并仔细分析数据,