代理失败的隐性成本

Agentic AI 显然已经超越了流行词的地位。麦肯锡 2025 年 11 月的调查显示,62% 的组织已经在试验人工智能代理,表现最好的组织以效率、增长和创新的名义将其推入核心工作流程。然而,这也是事情变得不舒服的地方。该领域的每个人都知道 [...]

来源:O'Reilly Media _AI & ML

Agentic AI 显然已经超越了流行词的地位。麦肯锡 2025 年 11 月的调查显示,62% 的组织已经在试验人工智能代理,表现最好的组织以效率、增长和创新的名义将其推入核心工作流程。

然而,这也是事情变得不舒服的地方。该领域的每个人都知道法学硕士是概率性的。我们都跟踪排行榜分数,但随后悄悄地忽略了当我们将多个模型连接在一起时这种不确定性会加剧。这就是盲点。大多数多智能体系统(MAS)不会因为模型不好而失败。它们之所以失败,是因为我们将它们组合起来,就好像概率不会复合一样。

多代理系统的架构债务

残酷的事实是,一旦错误不受控制地传播,改进单个代理对于提高整体系统级可靠性几乎没有作用。生产中代理系统的核心问题不仅仅在于模型质量,还在于模型质量。这是构图。一旦代理在没有验证边界的情况下连接在一起,风险就会加剧。

在实践中,这表现为循环监管、失控的代币成本、脆弱的工作流程以及间歇性出现且几乎不可能重现的故障。这些系统通常运行良好,足以通过基准测试,但一旦置于实际操作负载下,就会出现不可预测的故障。

如果您考虑一下,每次代理切换都会带来失败的机会。将足够多的这些因素串联在一起,就会导致失败的复合。即使每个智能体成功率为 98% 的强大模型也会很快将整个系统的成功率降低至 90% 或更低。每个未经检查的代理跳跃都会使失败概率成倍增加,从而使预期成本成倍增加。如果没有明确的容错能力,代理系统不仅脆弱。他们在经济上有问题。

多代理可靠性税

表 1 说明了代理系统如何在不进行验证的情况下通过系统传播错误。

从随机希望到确定性工程

从原型到生产