大型语言模型(LLMS)正在彻底改变AI,并在组合模块中表现出出色的推理能力,以执行基于图像的复杂任务。在本文中,我们提出了一种方法,该方法通过LLMS的图像扩展了程序组成的概念,旨在将它们整合到体现的代理中。具体来说,通过将PointGoal Navigation模型视为指导代理商通过世界的基础原始模型,我们幻想了单个模型如何无需其他培训即可解决不同的任务。我们将原始成分委托给LLM,只有少数在提示的示例。我们评估了三个体现的AI任务的方法:对象目标导航,实例图像目标导航和体现的问题答案,证明了竞争性结果,而没有任何特定的微调和在零拍情上的效力。