推荐引用建议的引文Etemadidavan,Sheida。“一种基于代理的方法,用于在随机环境中设计可持续的供应商选择:模拟研究”(2024)。哲学博士(博士学位),论文,工程管理与系统工程,旧多米尼奥大学,doi:10.25777/twvd-yd63 https://digitalcommons.odu.edu.edu.edu.edu/emse_etds/240
基于生成代理的建模(GABM)是一种新兴的模拟范式,将大型语言模型的推理能力与传统的基于代理的建模相结合,以复制复杂的社交行为,包括在社交媒体上进行互动。虽然先前的工作集中在局部现象(例如意见形成和信息传播)上,但其捕获全球网络动态的潜力仍然没有被逐渐消失。本文通过通过友谊悖论(FP)的角度分析基于GABM的社交媒体模拟来弥补这一差距,这是一种违反直觉现象,平均而言,个人的朋友比朋友的朋友少。我们为社交模拟的GABM框架提出了一个框架,其特征是模仿具有不同个性和兴趣的真实用户的生成代理。使用美国2020年选举和Qanon阴谋的Twitter数据集,我们表明FP自然出现在GABM模拟中。与现实世界的观察一致,模拟揭示了一个分层结构,在该结构中,代理优先与其他表现出更高活动或影响的人相连。此外,我们发现不频繁的连接主要驱动FP,反映了真实网络中的模式。这些发现将GABM验证为建模全球社交媒体现象的强大工具,并通过对用户行为进行细微的分析来强调其推进社会科学的潜力。
●含义:以前的AI代理(例如,感知,推理,世界模型,计划)面临的所有相同挑战仍然存在,但我们需要通过LLMS的新镜头进行重新检查,并处理新的镜头(例如,合成数据,自我反射,内部搜索,内部搜索)
毫米波小细胞与定向光束形成的密集部署是一种有前途的解决方案,可增强当前无线通信的净工作能力。但是,毫米波通信链路的可靠性可能会受到严重的路径,阻塞和耳聋的影响。作为一种款项,移动用户受到频繁的交接,这会限制用户吞吐量和移动终端的电池寿命。为了解决这个问题,我们的论文提出了一个深层的多代理控制学习框架,用于分布式移交管理,称为Rhando(增强移交)。我们将用户建模为代理商,他们在考虑相关成本的同时,学习如何执行移交以通过网络优化网络。所提出的SOUTIOT已完全分布,从而限制了信号传导和计算开销。数值结果表明,与传统方案相比,所提出的解决方案可以提供更高的吞吐量,同时大大限制了移交的频率。
当前的人工智能治理方法往往无法预测人工智能代理管理关键任务(例如财务运营、行政职能等)的未来。由于人工智能代理最终可能会在彼此之间委派任务以优化效率,因此了解人类价值交换的基本原则可以深入了解人工智能驱动型经济的运作方式。正如信任和价值交换是开放市场中人类互动的核心一样,它们对于实现人工智能代理之间的安全高效互动也至关重要。虽然加密货币可以作为人工智能代理之间协作和委派动态中价值交换货币化的基础,但一个关键问题仍然存在:这些代理如何可靠地确定信任对象,以及随着人工智能代理经济的扩大和发展,人类如何确保有意义的监督和控制?本文呼吁集体探索加密经济激励措施,这可以帮助设计去中心化的治理系统,使人工智能代理能够自主交互和交换价值,同时通过渐进式去中心化确保人类监督。为此,我提出了一项研究议程,使用 AgentBound 代币 (ABT) 来解决代理与代理之间的信任问题。ABT 是一种不可转让、不可替代的代币,与单个 AI 代理唯一绑定,类似于 Web3 中人类的 Soulbound 代币。通过权益证明机制将 ABT 作为代理与代理网络内自主行动的抵押品,代理可能会受到激励,促使其采取道德行为,并自动执行对不当行为的处罚。
游戏理论场景在评估基于大语言模型(LLM)的社会智慧的社会智能方面已成为关键。尽管许多研究在这种情况下探讨了这些代理,但缺乏全面的调查来概述当前的进展。为了解决这一差距,我们系统地回顾了有关游戏理论场景中基于LLM的SO-SOPIAL代理的现有研究。我们的调查将发现分为三个核心组成部分:游戏框架,社会代理和评估协议。游戏框架 - 工作涵盖了各种游戏方案,范围从选择以选择性到集中的游戏。社会代理人部分探讨了代理人的偏好,信念和推理能力。评估协议涵盖了用于评估代理性能的游戏不可能的指标和特定于游戏的指标。通过反思当前的研究并确定未来的研究方向,该调查提供了见解,以推动游戏理论场景中社会代理人的发展和评估。
摘要很长时间以来,研究人员寻求与人类智能相匹配或超过人类智能的人工智能(AI)。ai代理人是能够感知环境,做出决定和采取行动的人工实体,被视为实现这一目标的手段。已经为开发AI代理而进行了广泛的效果,主要关注重新发现算法或培训策略,以提高特定技能或特定的任务绩效。但是,该领域缺乏足够的一般且强大的模型,无法成为建立适合各种情况的普通代理的基础。凭借其多功能功能,大语言模型(LLMS)为开发一般AI代理的开发途径铺平了有希望的途径,并且在基于LLM的代理领域已取得了实质性进展。在本文中,我们对基于LLM的代理商进行了全面调查,涵盖了他们的施工框架,应用程序方案以及对基于LLM的代理商建造的社会的探索。我们还结论了这个浮游生物中的一些潜在的未来方向和开放问题。
自治AI代理人带来了变革的机会和重要的治理Challenges。现有的框架,例如《欧盟AI法案》和《 NIST AI风险管理框架》,无法解决这些代理的复杂性,这些代理能够独立决策,学习和适应。为了弥合这些差距,我们提出了精神(thical Technology and Holistic o Versight s y Sem)的框架 - 分散的治理(DEGOV)模型利用Web3技术,包括区块链,智能合约和De-Clentlized自主组织(DAOS)。精神为AI代理建立了全球注册表,从而通过Soulbound令牌和零知识证明的工具来实现动态风险分类,比例监督以及自动化的合规性监控。此外,该框架还结合了分散的司法系统,以解决透明的争议解决,并涉及AI特定的法律实体,以管理有限责任,并得到强制性保险的支持,以确保财务责任制并激励道德设计。通过整合理性,道德基础和目标一致性的哲学原则,旨在为促进信任,透明度和参与式治理创建一个巨大的研究议程。这个创新的框架为监管AI代理商提供了可扩展而包容的策略,平衡创新与道德责任,以满足AI驱动的未来的需求。
记忆体育馆展示了一套由2D部分可观察到的环境,即迫击炮混乱,神秘路径和灼热的聚光灯,旨在基于决策代理中的记忆能力。这些环境最初具有有限的任务,将其扩展为创新的,无尽的格式,反映了诸如“我打包我的书包”之类的累积内存游戏的不断挑战。任务设计中的这种进展将重点从仅评估样本效率转变为探测动态,延长场景中的记忆效果水平。为了解决可用的基于内存的深钢筋学习基线中的差距,我们在开源清洁库中介绍了一个实现,该库将变形金刚-XL(TRXL)与近端的pol-Pol-Pol-Cy-Cy-Cy-Cy-Cy-Cy-Cy-Cy-Cy-Cy-Cy-Cyizatization中进行了实现。这种方法采用滑动窗口技术利用TRXL作为情节内存的一种形式。我们在封闭式复发单元(GRU)和TRXL之间的比较研究揭示了我们有限和无尽任务的各种表现。trxl在有限的环境上表现出优于GRU的效果,但仅在利用辅助损失来重建观测值时。值得注意的是,Gru在所有无尽的任务中都表现出色,始终优于显着的边距TRXL。网站和源代码:https://marcometer.github.io/jmlr_2024.github.io/关键字:深增强学习,actor-Critic-Critic,记忆,内存,变形金刚,重复
风险管理对于任何受监管实体业务的行为至关重要。它必须构成实体文化的组成部分,并且必须由董事会和高级管理层设定基调。风险管理的质量就依赖于强大的治理以及独立和客观的监督功能。AMF评估董事会,高级管理层和国防界(包括风险管理文化)的质量,有效性和互动。对这些功能的评估尤其是基于指南中规定的期望4,并遵守法律,法规和规范性规定。