人工智能 (AI) 是设计为像人类一样思考和行动的机器。将 AI 放入虚拟世界,它们就被称为 AI 代理,它使用从训练中获得的知识在世界中执行任务。虚拟世界中的 AI 代理只能在复杂度和多样性有限的环境中使用专门的模型执行一组狭窄的任务。一个需要代理不断学习和适应各种开放式任务并使用先前获得的知识来确定下一步行动的丰富世界将使代理无能为力。为了研究用于指导代理执行 Minecraft 中的基本任务的 AI 教学方法,以确定哪种 AI 教学方法会产生最佳效果,进行了系统的文献综述,提取了 57 篇论文并确定了适合 AI 代理训练方法和功能的主题和子主题。这是为发现可以实施哪些 AI 训练方法,使代理能够在复杂而丰富的世界中执行任务,从而促进基于游戏的学习。研究发现,将强化学习 (RL) 方法与有效的奖励系统完美结合,可为代理提供必要的知识,使其能够在更复杂的层面上执行任务。RL 集成了一系列独特的方法,例如牛顿动作建议 (NAA)、行为克隆 (BC)、视频预训练 (VPT)、人类演示和自然语言命令,以实现特定目标。这意味着可以通过建立一个深思熟虑的框架来教导代理在复杂的环境中执行开放式任务,该框架涉及如何在各个领域教导代理,从而有可能通过基于游戏的学习将这些教导融入现实世界。关键词:基于游戏的学习;社会 5.0 教育;我的世界强化学习;AI 代理;训练 AI 代理
摘要。AI研究界的基本任务之一是建立一个自主体现的代理,该代理可以在各种各样的任务中实现高级绩效。但是,为所有开放式任务获取或手动设计奖励是不现实的。在本文中,我们提出了一种新颖的跨模式对比学习框架 - 夹子4MC,旨在学习加强学习(RL)友好的视觉语言模型(VLM),该模型(VLM)充当开放式任务的无限奖励功能。仅利用视频片段和语言提示之间的模拟性不友好,因为标准VLMS只能在粗级上捕获相似性。为了实现RL友好性,我们将任务完成学位纳入了VLM培训目标,因为这些信息可以根据区分不同状态之间的重要性。此外,我们根据MinedoJo提供的大规模YouTube数据库提供整洁的YouTube数据集。具体来说,两轮过滤操作保证数据集涵盖了足够的基本信息,并且视频文本对高度相关。经验,我们证明了所提出的方法与基准相比,在RL任务上可以更好地进行性能。代码和数据集可在https://github.com/pku-rl/clip4mc上找到。
使用MineFlayer,神经网络的实现提供了很大的灵活性。硬编码的行为,例如机器人的收集,移动,构建和其他行为,可以改变为程序员的愿望。可以创建一个新的数据集,可以创建并用于训练新的网络以身份洞穴;煤炭,铁和钻石等矿石上的数据集可用于训练机器人进行采矿。可以使用州机器来切换神经网络和行为,以通过理想的自主权执行更复杂的任务。参考
以开放式、基于项目的学习为重点的本科课程教学生如何定义具体目标,将对算法的概念理解转化为代码,并评估/分析/展示他们的解决方案。然而,人工智能和机器学习在方法和应用方面都变得越来越多样化,这使得设计涵盖足够广泛的人工智能领域的项目课程具有挑战性。出于这些原因,现有的人工智能项目课程仅限于一组狭窄的方法(例如仅强化学习)或应用程序(例如仅计算机视觉)。在本文中,我们建议使用 Minecraft 作为通过基于项目的学习教授人工智能的平台。Minecraft 是一款开放世界沙盒游戏,包含探索、资源收集、制作、建造和战斗等元素,由 Malmo 库支持,该库为玩家在不同粒度级别的观察和操作提供了编程接口。在 Minecraft 中,学生可以设计项目,使用基于搜索的 AI、强化学习、监督学习和约束满足等方法处理文本、音频、图像和表格数据等数据类型。我们描述了使用 Minecraft 的开放式本科 AI 项目课程的经验,其中包括 82 个不同的项目,涵盖从导航、指令跟踪、对象检测、战斗到音乐/图像生成等主题。
speech2craft • 命令跟随机器人 • 导航、收集等• 语音识别、NLP 解析 • https://hiroishikawa.github.io/speech2craft/