详细内容或原文请订阅后点击阅览
Google DeepMind 担心当数百万智能体开始交互时会发生什么
Google DeepMind 正在资助研究数百万个不同的人工智能代理在线交互的潜在危险。负责该公司 AGI 安全和一致性研究的 Rohin Shah 表示,大众市场出现的智能体可以在没有人类监督的情况下执行任务,并遵循其他人给他们的指示……
来源:MIT Technology Review _人工智能(我问 Shah,他们是否更多地考虑最坏的情况,例如大范围的经济崩溃。“如果我们在年底之前讨论的话,当然不会,”他说。那只有六个月了!他笑了。“好吧,在那之后一段时间。”)
Shah 和 Fox 都认为,了解大量多智能体系统相互交互时可能发生的情况的唯一方法是运行真实的模拟。他们希望研究人员将人工智能代理放入沙箱中并研究它们的作用。
你无法通过孤立地研究单个智能体,甚至一小群智能体来预测会发生什么。福克斯说,你不能假设以法学硕士为基础的人工智能代理总是会理性行事。复杂性来自于同时进行大量交互。
包括 Google DeepMind 团队在内的一些研究人员认为,通用人工智能(如果可能的话)可能不是来自单个超级智能模型,而是来自一种代理蜂巢思维,其中整体的能力加起来超过其各个部分的能力之和。
缺乏信任
谷歌 DeepMind 并不是唯一一家对其正在开发的技术的风险发出警告的顶级人工智能公司。几周前,Anthropic 发布了基于一种称为零信任的网络安全方法部署人工智能代理的指南,该方法首先假设计算机系统容易受到攻击,代理是攻击者,并且会发生漏洞。
特拉维夫网络安全公司 Akeyless 的联合创始人兼首席技术官 Refael Angel 同意,了解基于代理的系统带来的新风险至关重要。
过去的每一种安全方法都假设相关机器是由人类编写的软件,在固定路径上执行固定的操作,Angel 说:“代理打破了所有这些假设。它推理,它即兴发挥,并且它可以被埋在它被要求阅读的文档中的单个句子劫持。”
