Loading...
机构名称:
¥ 1.0

摘要。在本研究中,我们解决了使官方情报代理在虚拟环境中执行复杂语言指令的问题。在我们的框架中,我们假设这些指令涉及复杂的语言结构和必须成功导航以实现所需结果的多个依赖性任务。为了有效地管理这些复杂性,我们提出了一个分层框架,将大型语言模型的深层语言理解与适应性的动作结合 - 强化学习剂的执行能力:语言模块(基于LLM)将语言指令转化为高级行动计划,并由预先培养的启用方法进行了指示。 Iglu,指示代理人建造结构,在手工艺品中,代理人根据语言命令在周围环境中执行任务并与周围环境中的对象进行交互。

在虚拟环境中以目标条件为条件的强化学习以下指令

在虚拟环境中以目标条件为条件的强化学习以下指令PDF文件第1页

在虚拟环境中以目标条件为条件的强化学习以下指令PDF文件第2页

在虚拟环境中以目标条件为条件的强化学习以下指令PDF文件第3页

在虚拟环境中以目标条件为条件的强化学习以下指令PDF文件第4页

在虚拟环境中以目标条件为条件的强化学习以下指令PDF文件第5页