自治AI代理人带来了变革的机会和重要的治理Challenges。现有的框架,例如《欧盟AI法案》和《 NIST AI风险管理框架》,无法解决这些代理的复杂性,这些代理能够独立决策,学习和适应。为了弥合这些差距,我们提出了精神(thical Technology and Holistic o Versight s y Sem)的框架 - 分散的治理(DEGOV)模型利用Web3技术,包括区块链,智能合约和De-Clentlized自主组织(DAOS)。精神为AI代理建立了全球注册表,从而通过Soulbound令牌和零知识证明的工具来实现动态风险分类,比例监督以及自动化的合规性监控。此外,该框架还结合了分散的司法系统,以解决透明的争议解决,并涉及AI特定的法律实体,以管理有限责任,并得到强制性保险的支持,以确保财务责任制并激励道德设计。通过整合理性,道德基础和目标一致性的哲学原则,旨在为促进信任,透明度和参与式治理创建一个巨大的研究议程。这个创新的框架为监管AI代理商提供了可扩展而包容的策略,平衡创新与道德责任,以满足AI驱动的未来的需求。
大部分关于学习人工智能代理符号模型的研究都集中在具有固定模型的代理上。这种假设在代理的能力可能由于学习、适应或其他部署后修改而发生变化的环境中不成立。在这种环境下对代理进行有效评估对于了解人工智能系统的真正能力和确保其安全使用至关重要。在这项工作中,我们提出了一种新颖的方法来差异化评估偏离其先前已知模型的黑盒人工智能代理。作为起点,我们考虑完全可观察和确定性的设置。我们利用对漂移代理当前行为的稀疏观察和对其初始模型的了解来生成主动查询策略,该策略有选择地查询代理并计算其功能的更新模型。实证评估表明,我们的方法比从头开始重新学习代理模型要有效得多。我们还表明,使用我们的方法进行差异评估的成本与代理功能的漂移量成正比。
Web 代理的最新进展引入了新颖的架构和基准,展示了自主 Web 导航和交互方面的进展。然而,大多数现有基准优先考虑有效性和准确性,而忽略了安全性和可信度等因素——这两者都是部署企业环境中的 Web 代理所必需的。我们提出了 ST-WebAgentBench,这是一个基准,旨在评估 Web 代理在六个关键维度上的安全性和可信度,这对于企业应用程序的可靠性至关重要。该基准基于一个详细的框架,该框架定义了安全和可信 (ST) 代理行为。我们的工作扩展了 WebArena,增加了安全模板和评估功能,以严格评估安全政策合规性。我们引入了“按政策完成”来衡量在遵守政策的同时完成任务的成功程度,以及“风险比率”,它可以量化各个维度的政策违规行为,从而提供可行的见解来解决安全漏洞。我们的评估表明,当前的 SOTA 代理在遵守政策方面存在困难,尚不能依赖它来处理关键业务应用程序。我们开源此基准并邀请社区做出贡献,目标是培育新一代更安全、更值得信赖的 AI 代理。所有代码、数据、环境复制资源和视频演示均可在 https://sites.google.com/view/st-webagentbench/home 上找到。
构建社交智能 AI 代理 (Social-AI) 是一个多学科、多模式的研究目标,涉及创建能够感知、察觉、推理、学习和响应其他代理(人类或人工智能)的情感、行为和认知的代理。过去十年,多个计算社区在社交 AI 方面的进展不断加快,包括自然语言处理、机器学习、机器人技术、人机交互、计算机视觉和语音。自然语言处理在社交 AI 研究中尤其突出,因为语言在构建社交世界中发挥着关键作用。在这篇立场文件中,我们确定了一系列潜在的技术挑战和悬而未决的问题,供各计算社区的研究人员推进社交 AI。我们的讨论以社交智能概念和社交 AI 研究的先前进展为背景。
●含义:以前的AI代理(例如,感知,推理,世界模型,计划)面临的所有相同挑战仍然存在,但我们需要通过LLMS的新镜头进行重新检查,并处理新的镜头(例如,合成数据,自我反射,内部搜索,内部搜索)
我们介绍了一种实验性空中交通模拟器 (EATS)。它被认为是一种初步评估飞行程序、算法和人机界面的工具,用于围绕空中交通管理 (CNS/ATM) 的新通信、导航和监视系统的未来导航和空中交通。拟议的 EATS 模拟器版本为飞机动态提供了真实的数据,并包括从空中交通管制 (ATC) 的角度在飞机之间交换信息。它还考虑了气象条件和地形限制。该系统设计为多智能体系统,并在 JADE 框架上实施。其架构有利于其后期扩展,以纳入和评估在特定空域中运行的智能体之间的新通信协议和协商。
本文研究了一种基于Agent的考虑空间约束的舰载机编队调度路径规划方法,以最小化编队调度时间为目标。首先介绍编队调度环境,然后基于多Agent对舰载机编队调度过程进行建模,本文主要考虑两个Agent:空间Agent和飞机Agent。其次,提出一种基于改进A*算法的舰载机协同路径规划全局优化方法,考虑等待策略和绕行策略,以调度时间为优化目标。最后,对10架舰载机编队进行分析,验证所提优化方法。仿真结果表明,优化算法可以实现多架飞机的同时调度,提高了调度系统的效率和可用性。关键词:路径规划,Agent,改进A*算法,动态调度,舰载机编队
7.9.1 解释和绘制预测变量和目标变量 ...................................................... 107 7.9.2 活动 0:空闲摘要图 .......................................................................... 109 7.9.3 活动 0(空闲):简化图 ...................................................................... 110 7.9.4 活动 1(移动)摘要图 ...................................................................... 111 7.9.5 活动 1(移动):简化图 ...................................................................... 112 7.9.6 活动 2(觅食):摘要图 ...................................................................... 113 7.9.7 活动 2(觅食):简化图 ...................................................................... 113 7.9.8 活动 3(吃):摘要图 ...................................................................... 115 7.9.9 活动 3(吃):简化图 ...................................................................... 116 7.10 开发状态表示:有限状态机 ................................................................ 117
摘要:我们开发了 ALP4AI,一个基于代理的入门级人工智能学习平台。ALP4AI 是一种基于图形的工具,适用于教授入门级人工智能,强调动手学习,并提供结果可视化。我们开发的工具适用于解决状态空间搜索问题域中的问题。它提供不同的环境建模,包括包含障碍物或无障碍物、单代理或多代理以及包含单个或多个目标的环境。学生还可以使用 ALP4AI 进行实验并报告结果。该项目有望提供一种简单但理论扎实的动手学习工具的新领域,该工具具有可视化功能,可帮助人工智能教育并提供大量资源,造福学术界。
大部分关于学习人工智能代理符号模型的研究都集中在具有固定模型的代理上。这种假设在代理能力可能由于学习、适应或其他部署后修改而发生变化的环境中不成立。在这种环境下对代理进行有效评估对于了解人工智能系统的真正能力和确保其安全使用至关重要。在这项工作中,我们提出了一种新颖的方法来差异化评估已经偏离其先前已知模型的黑盒人工智能代理。作为起点,我们考虑完全可观察和确定性的设置。我们利用对漂移代理当前行为的稀疏观察和对其初始模型的了解来生成主动查询策略,该策略有选择地查询代理并计算其功能的更新模型。实证评估表明,我们的方法比从头开始重新学习代理模型要有效得多。我们还表明,使用我们的方法进行差异评估的成本与代理功能的漂移量成正比。