详细内容或原文请订阅后点击阅览
衡量人工智能代理时代的重要因素
本文首次出现在 Mike Amundsen 的《我们过去的未来的信号》时事通讯中,经作者许可在此重新发布。我们早已过了人工智能辅助编码的新颖阶段。新的挑战是测量。我们如何知道所有这些增强功能——Copilot、Cursor、Goose、Gemini——是否真的让我们在重要的事情上做得更好? [...]
来源:O'Reilly Media _AI & ML我们早已过了人工智能辅助编码的新颖阶段。新的挑战是测量。我们如何知道所有这些增强功能——Copilot、Cursor、Goose、Gemini——是否真的让我们在重要的事情上做得更好?
DX 团队为回答这个问题提供了第一个可靠的尝试。他们的人工智能测量框架侧重于三个维度:利用率、影响和成本。他们将这些与 DX Core 4 配对:1) 变更失败率,2) PR 吞吐量,3) 感知交付速度,以及 4) 开发人员体验。它们共同帮助公司观察人工智能如何改变生产系统的动态。
例如,在 Booking.com,这意味着几个月内吞吐量提升了 16%。在 Block,它为他们内部人工智能代理 goose 的设计提供了信息。这项工作的更广泛背景在 Gergely Orosz 的实用工程师深入研究中得到了体现,它将 DX 首席技术官 Laura Tacho 的研究与 18 家主要科技公司如何学习跟踪人工智能对工程绩效的影响联系起来。
代理作为扩展
DX 框架传达的信息既简单又激进:将编码代理视为团队的延伸,而不是独立的贡献者。这个想法改变了一切。它将生产力重新定义为混合团队(人类及其人工智能扩展)的属性,并以我们已经衡量领导力的方式来衡量绩效:通过人类如何有效地指导他们的代理“团队”。
它还要求重新平衡我们的指标。人工智能速度的提升不能以牺牲可维护性或清晰度为代价。最成熟的组织正在跟踪节省的时间和损失的时间,因为自动化的每一次进步都会在系统的其他地方产生新的复杂性。当反馈循环闭合时,人工智能就不再是新鲜事物,而是成为突出组织生态系统的一个活生生的部分的可供性。
共同理解
这里更深层的信号与仪表板或 KPI 无关。这是关于我们如何有意义地适应开发人员、代理和系统之间界限模糊的世界。
