详细内容或原文请订阅后点击阅览
他们承诺给我们代理,但我们得到的只是静态链
2023 年春天,世界对基于 LLM 的 AI 代理的出现感到兴奋。AutoGPT 和 BabyAGI 等强大的演示展示了 LLM 循环运行的潜力,选择下一个操作,观察其结果,然后一步一步选择下一个操作(也称为 ReACT 框架)。这 […] 他们向我们承诺代理,但我们得到的只是静态链,这篇文章首先出现在 Unite.AI 上。
来源:Unite.AI2023 年春天,基于 LLM 的 AI 代理的出现让全世界兴奋不已。AutoGPT 和 BabyAGI 等强大的演示展示了 LLM 循环运行的潜力,一步一步地选择下一个操作、观察其结果并选择下一个操作(也称为 ReACT 框架)。这种新方法有望为能够自主且通用地执行多步骤任务的代理提供动力。给它一个目标和一套工具,它会处理剩下的事情。到 2024 年底,人工智能代理和人工智能代理构建框架将随处可见。但他们如何衡量承诺呢?
AutoGPT BabyAGI可以肯定地说,由简单的 ReACT 框架驱动的代理受到严重限制。给他们一个需要多个步骤、使用多个工具的任务,他们就会惨败。除了明显的延迟问题之外,它们还会迷失方向、无法遵循指令、过早或过晚停止,并且每次尝试都会产生截然不同的结果。这也不足为奇。ReACT 框架克服了不可预测的 LLM 的局限性,并通过步骤数量将其复合起来。然而,希望解决实际用例(尤其是在企业中)的代理构建者无法达到这种性能水平。他们需要可靠、可预测和可解释的结果,以实现复杂的多步骤工作流。他们需要能够缓解而不是加剧 LLM 不可预测性的 AI 系统。
ReACT 框架这种权衡可以用下图表示:
这就引出了一个问题,为什么我们还没有看到可以放在右上象限的代理框架?我们注定要永远用可靠性换取自主性吗?我们能否在不牺牲可靠性的情况下获得一个提供 ReACT 代理的简单接口(采用一个目标和一组工具并弄清楚)的框架?