零人类代码:我从强迫AI构建(并修复)自己的代码连续27天所学到的东西

27天,1,700多个投入,99,9%的人工智能生成的代码围绕AI开发工具的叙述已越来越脱离现实。 YouTube充满了使用AI助手在数小时内构建复杂应用程序的主张。真相?我花了27天的时间在严格的约束下构建目标距离:AI工具将处理所有编码,调试以及[…]零后人类代码:我从强迫AI构建(并修复)自己的代码连续27天中学到了什么首先出现在数据科学上。

来源:走向数据科学

27天,1,700多个提交,99,9%AI生成的代码

27天,1,700多个提交,99,9%AI生成的代码

围绕AI开发工具的叙述已经越来越脱离现实。 YouTube充满了使用AI助手在数小时内构建复杂应用程序的主张。真相?

我花了27天的时间在严格的限制下构建“目标”:AI工具将处理所有编码,调试和实施,而我纯粹是作为编排的。这不仅仅是建造产品,这是对代理AI开发的真正能力的严格实验。

oppromentivescope 代理AI
一个昏暗的AI实习生和沮丧的产品经理走进了酒吧……(作者图片)
一个昏暗的AI实习生和沮丧的产品经理走进了酒吧……(作者图片)

实验设计

实验设计

两个平行目标推动了此项目:

    通过维护严格的“无直接代码更改”策略
  • 将周末原型转换为全方位服务的产品
  • 通过维护严格的“无直接代码更改”策略来测试AI驱动开发的实际限制
  • 这种自我施加的约束至关重要:与典型的AI辅助开发不同,开发人员可以自由修改代码,我只会提供指示和方向。 AI工具必须处理其他所有内容 - 从编写初始功能到调试自己生成的问题。这意味着,即使是简单的修复,通常需要几秒钟才能手动实施,通常需要仔细提示和耐心才能将AI引导到解决方案上。

    规则

    规则
      没有直接的代码修改(关键的模型名称校正除外 - 约0.1%的提交)必须通过AI工具本身的功能实现来确定所有错误,必须完全通过AIMY角色来完成,仅限于提供指示,上下文和指导
  • 所有错误必须由AI工具本身修复
  • AI开发