详细内容或原文请订阅后点击阅览
不要让关于AI特工的炒作领先于现实
Google最近揭幕了它所谓的“新的代理体验”,就像一个转折点。例如,在5月的I/O 2025活动中,该公司展示了一个数字助理,不仅仅回答问题。它通过查找匹配的用户手册,找到YouTube来帮助进行自行车维修。
来源:MIT Technology Review _人工智能让我们从“代理”本身开始。目前,它被从简单脚本到精致的AI工作流程中都拍打了。没有共同的定义,这为公司销售基本自动化的空间有足够的空间,因为它更高级。这种“代理洗礼”不仅会使客户感到困惑;它引起了失望。我们不一定需要一个严格的标准,但是我们确实需要对这些系统应该做什么,自主操作的工作方式以及它们的可靠性更清晰的期望。
和可靠性是下一个大挑战。当今的大多数代理商都由大型语言模型(LLMS)提供动力,这些模型会产生概率反应。这些系统功能强大,但也无法预测。他们可以弥补,脱离轨道或以微妙的方式失败,尤其是当他们被要求完成多步骤任务,聘请外部工具并将LLM响应融合在一起时。一个最近的例子:自动化支持代理人告诉Cursor的用户,是一位受欢迎的AI编程助理,他们无法在一个以上的设备上使用该软件。有广泛的投诉和报告取消其订阅的报告。但事实证明,该政策不存在。 AI发明了它。
该策略不存在