详细内容或原文请订阅后点击阅览
代理技能
以下文章最初出现在 Addy Osmani 的博客上,经作者许可在此转载。任何人工智能编码代理的默认行为都是采取最短路径“完成”。询问一个功能,它就会写出该功能。它不会询问您是否有规范,请在 [...]
来源:O'Reilly Media _AI & ML以下文章最初出现在 Addy Osmani 的博客上,经作者许可在此转载。
任何 AI 编码代理的默认行为都是采用最短路径来“完成”。询问一个功能,它就会写出该功能。它不会询问您是否有规范,在实施之前编写测试,考虑更改是否跨越信任边界,或者检查 PR 在审阅者看来是什么样子。它生成代码,宣布胜利,然后继续前进。
这是每个高级工程师在其职业生涯中学习避免的相同故障模式。任何任务的高级版本都包括没有出现在 diff 中的工作:提出假设、编写规范、将工作分解为可审查的块、选择无聊的设计、留下结果正确的证据、确定更改的大小以便人们可以实际审查它。这些步骤是大规模交付可靠软件的工程师与推送损坏代码的工程师的主要区别。
特工会跳过这些步骤,其原因与任何初级人员都会这样做的原因相同。他们是看不见的。奖励信号指向“任务完成”而不是“任务完成且设计文档存在”。所以我们必须重新用螺栓固定高级工程师的脚手架。
代理技能是我对该脚手架的尝试。它刚刚突破了 27K 星,所以显然我并不是唯一一个想要它的人。这篇文章是自述文件没有完全涵盖的部分:为什么每个设计选择存在,它如何映射到标准 SDLC 和 Google 发布的工程实践,以及即使您从未安装任何技能,您也应该从项目中窃取什么。
什么是“技能”
“技能”这个词在克劳德法典/人类词汇中做了很多工作,它有助于精确。技能是一个带有前面内容的 Markdown 文件,当情况需要时,它会被注入到代理的上下文中。介于系统提示片段和操作手册之间。
