摘要:应急物资计划调度旨在高效地将应急物资调度到目的地,减少因物资短缺造成的财产损失和人员伤亡。现有研究通常依赖于运输路线的优化,忽略了人力和物力同时参与调度的丰富场景,而且突发事件可能涉及多个物资需求点的供给。针对这些问题,我们提出了一种人工智能规划方法来建模应急物资调度领域,并使用PDDL构建标准规划任务。然后采用最先进的规划器来解决生成的规划任务。实验结果表明,所提出的方法能够贴合紧急情况的实际情况,并为指导应急物资计划调度提供高质量的指导。
解决复杂的计划问题需要大型语言模型(LLMS)明确对状态过渡进行建模,以避免规则违规,遵守限制并确保操作性 - 这是由自然语言固有的歧义所阻碍的任务。为了克服这种歧义,规划域定义语言(PDDL)被杠杆化为一种计划,以实现精确和正式的状态描述。使用PDDL,我们可以生成一个象征性的世界模型,其中经典的搜索算法(例如A ∗)可以无缝地找到最佳计划。但是,由于缺乏PDDL培训数据,直接生成具有当前LLM的PDDL域仍然是一个开放的挑战。为了应对这一挑战,我们建议扩大LLMS的测试时间计算以增强其PDDL推理功能,从而使高质量的PDDL域的产生。具体来说,我们引入了一种简单而有效的算法,该算法首先采用了最佳的N采样方法来提高初始解决方案的质量,然后通过口头化的机器学习以细粒度的方式优化解决方案。我们的方法在PDDL域的产生中大大优于O1-Mini,在两个任务上达到了超过50%的成功率(即,从自然语言描述或PDDL问题中生成PDDL域)。这是在不需要额外培训的情况下完成的。通过利用PDDL作为状态抽象,我们的方法能够在几乎所有竞争级的计划任务上都超过当前最新方法。
摘要 - 按钮规划功能对于智能机器人在物理世界中自动运行至关重要。但是,基于传统的计划域定义语言(PDDL)方法通常会遭受组合爆炸和无效的计划时间。在本文中,我们以创新的方式提出了使用大型语言模型(LLM)增强机器人任务计划 - 使用LLMS指导PDDL计划者的搜索过程,而不是完全替换PDDL计划。LLMS通过学习的启发式方法指导PDDL计划者的搜索过程,并提供约束推理以减少搜索空间。为了解决LLM的潜在陷阱,在执行阶段添加了验证机制,以验证计划正确性。我们在真实情况下拆卸了寿命电池电池的末端评估了我们的方法。实验结果将纳入计划管道中的LLM可以显着提高计划效率和可伸缩性,同时保持计划有效性。这项研究为将语言模型与经典方法整合在一起,为实用应用增强机器人智能。所提出的框架在增强未来智能机器人系统的任务计划能力方面迈出了坚实的一步。
摘要 - 符号推理系统已在认知体系结构中使用,以提供推理和规划能力。但是,定义域和问题已被证明很困难且容易出错。此外,大型语言模型(LLMS)已成为处理自然语言的工具,以处理不同的任务。在本文中,我们建议使用LLM来解决这些问题。以这种方式,本文提出了在ROS 2集成的认知架构Merlin2中用于自动机器人的llms的整体。具体来说,我们介绍了如何利用LLM在Merlin2的审议过程中的推理能力的设计,开发和部署。因此,对基于PDDL的规划师系统的审议系统更新为自然语言规划系统。该建议对定量和定性进行评估,以衡量将LLM纳入认知体系结构的影响。结果表明,经典方法可以实现更好的性能,但是拟议的解决方案通过自然语言提供了增强的互动。
在数字时代,了解网络中信息传播和意见形成的动态至关重要。这项研究介绍了一个创新的框架,该框架通过自动化计划的战略性范围来确定意见动力学的原则。据我们所知,我们已经开发了有史以来第一个用于意见动态的数字PDDL。我们的工具使用户能够可视化复杂的网络,模拟观点的演变,并从战略上影响实现特定外观的进化。通过利用自动化计划技术,我们的框架提供了一种细微的方法,可以设计用于将网络从其当前意见格局转变为所需状态的一系列动作序列。这种整体方法为网络中各个节点的复杂相互作用提供了见解,并为有针对性的Interventions铺平了道路。此外,该工具促进了人类的集合,使用户不仅能够了解信息传播,而且还制定了实用策略,以减轻从中产生的有害结果。演示视频链接-https://tinyurl.com/3k7bp99h
随着我们越来越依赖人工智能系统来实现生活中越来越多的应用,理解和解释此类系统的需求也变得更加明显,无论是为了改进、信任还是法律责任。人工智能规划是一种提供解释挑战的任务,特别是由于生成的计划越来越复杂,以及连接行动并决定整体计划结构的复杂因果链。虽然最近有许多支持计划解释的技术,但用于浏览这些数据的视觉辅助工具却非常有限。此外,专注于抽象规划概念和领域相关解释的技术之间往往存在障碍。在本文中,我们提出了一种可视化分析工具来支持计划总结和交互,重点关注使用基于参与者的结构的机器人领域。我们展示了用户如何快速掌握有关计划中涉及的行动的重要信息以及它们之间的关系。最后,我们提出了一个用于设计工具的框架,重点介绍了如何将一般的 PDDL 元素转换为视觉表示,并进一步将概念与领域联系起来。
在现实环境中,为规划指定高级知识库的问题变得非常艰巨。这些知识通常是手工制作的,即使对于系统专家来说也很难保持更新。最近的方法表明,即使缺少所有中间状态,经典规划也能成功合成动作模型。这些方法可以从一组执行轨迹中合成规划域定义语言 (PDDL) 中的动作模式,每个执行轨迹至少包含一个初始状态和最终状态。在本文中,我们提出了一种新算法,当动作特征未知时,使用经典规划器无监督地合成 S TRIPS 动作模型。此外,我们还对经典规划做出了贡献,该规划减轻了在动作模型前提条件中学习静态谓词的问题,利用 SAT 规划器的功能和并行编码来计算动作模式并验证所有实例。我们的系统非常灵活,因为它支持包含可能加快搜索速度的部分输入信息。我们通过几个实验展示了学习到的动作模型如何概括看不见的规划实例。
使用生成式人工智能为自主系统生成行动计划。联系人 Damien Pellier (Damien.Pellier@imag.fr) LIG-Marvin Humbert Fiorino (Humbert.Fiorino@imag.fr) LIG-Marvin,关键词 自动规划,生成式人工智能 上下文 自动规划 [1] 是人工智能的一个领域,其目的是设计决策算法用于自主系统,即机器人、无人机、机器人等代理。由于这些系统无需人工监督即可“自主”运行,因此它们必须始终制定行动计划以实现分配给它们的目标。众所周知,自主规划是 NP 难问题,而领域特定语言 (DSL)(如 PDDL(规划领域描述语言)[2])被设计用于将代理任务(行动、目标和世界状态等)建模/指定为规划问题。计划生成基于许多经典的 AI 技术,例如树搜索和启发式搜索、SAT 或 CSP 问题求解等(有关更多详细信息,请参阅 PDDL4J [3] 和 [1])。同时,生成人工智能(也称为生成 AI 或 GenAI [4])是能够使用生成模型生成文本、图像或其他媒体的人工智能 [5][6][7]。生成 AI 模型学习其输入训练数据的模式和结构,然后生成具有相似特征的新数据。在 2020 年代初期,基于 Transformer 的深度神经网络的进步使许多生成 AI 系统成为可能,这些系统以接受自然语言提示作为输入而闻名。其中包括大型语言模型聊天机器人(如 ChatGPT、Bing Chat、Bard 和 LLaMA)以及文本到图像的人工智能艺术系统(如 Stable Diffusion、Midjourney 和 DALL-E)。
当前的学术脆弱性研究主要是为了识别程序和系统中的单个错误和漏洞。然而,这与依赖一系列步骤(即一系列漏洞)实现其目标的序列的现代高级攻击的趋势不断增长,通常会纳入单独的良性行动。本文为使用AI计划自动发现了这种剥削链的自动发现。尤其是我们旨在发现特权升级链,这是一些最关键和最普遍的策略威胁,涉及利用脆弱性以获得未经授权的访问和对系统的控制。我们将方法作为一种工具,即链反应器,将问题建模为一系列动作,以实现从初始访问目标系统的特权升级。链反应器提取有关目标可执行文件,系统配置和已知漏洞的信息,并将此数据编码为计划域定义语言(PDDL)问题。使用现代计划者,ChainReactor可以生成结合脆弱性和良性动作的链条。我们评估了3个综合脆弱VM,504个现实世界的亚马逊EC2和177个数字海洋实例的链反应器,证明了其重新发现已知特权库存利用的能力,并确定了以前未报告的新链。具体而言,评估表明,链反应器成功地重新发现了捕获链中的漏洞链(CTF)机器,并确定了16个亚马逊EC2和4个数字海洋VM的零日链。
舞蹈机器人领域吸引了众多领域的关注。例如,索尼推出了一款名为 QRIO 的人形机器人(Geppert 2004),它可以通过模仿人类的舞蹈以高度协调的方式与多个单元一起跳舞。Nakaoka 等人探索了一种动作捕捉系统来教机器人 HRP-2 跳日本传统民间舞蹈(Nakaoka 等人 2005)。尽管之前的系统取得了成功,但它们通常要么局限于一组预先定义的动作(伴随着音乐),要么根据外部刺激表现出很小的变化。为了提高舞蹈的变化性,Bi 等人提出让有腿的机器人以多样化的方式与音乐同步跳舞(Bi 等人 2018)。他们根据音乐的节拍从舞蹈动作库中挑选动作,创作了一种舞蹈编排。舞蹈动作包括各种踏步和基本动作。从库中挑选动作的过程由马尔可夫链定义,它取决于先前挑选的舞蹈动作和当前音乐节奏。在那些基于概率图模型的方法中,由于概率模型在表示舞蹈动作之间的逻辑关系方面的局限性,通常会选择与先前动作不合理的动作。在本演示中,我们设计了一个名为 Plan2Dance 的系统,以基于音乐创作舞蹈编排。通过考虑动作的时间要求,基于基本舞蹈动作的关系构建了一组动作模型(以 PDDL(Fox and Long 2003)语言的形式)。