我试图通过免费的 vivi 编码节省 1,200 美元 - 但很快就后悔了

我想相信这个免费的人工智能编码工具可以取代 Claude Code。但它还没有准备好迎接黄金时段。

来源:ZDNet | 机器人新闻

关注 ZDNET:将我们添加为 Google 上的首选来源。

ZDNET 的关键要点

  • 免费的本地人工智能很有前途,但浪费时间比订阅成本更高。
  • 随机、无法解释的编辑使代码每次迭代都变得更糟。
  • 没有屏幕截图,修复 Xcode 错误就变得很困难。
  • 嗯,这真是太糟糕了。在使用 Goose、Ollama 和 Qwen3-coder 的免费本地(如在我自己的计算机上)组合构建一个简单的 WordPress 插件后,我非常希望能够放弃昂贵的 Claude Code 订阅并使用免费的替代方案。公平地说,当我在开发测试插件时,Goose 花了五次尝试才成功(比任何其他人工智能都多),但它最终还是成功了。

    另外:我尝试了 Claude Code 的竞争对手,它是本地的、开源的、完全免费的 - 效果如何

    每个月向 OpenAI 或 Anthropic 支付几百美元让他们的云 AI 为我编写代码是一笔相当大的开支。因此,我一直在探索 Goose、Ollama 和 Qwen3-coder 的组合,看看它是否可以取代我的 Claude Code 订阅。

    不。不,不,不。

    大型前沿人工智能模型(“前沿”意味着他们的投资者想要十亿美元的估值)使用 SWE-Bench Pro 和 GDPval-AA 等基准来支持他们的说法,即他们的产品是有史以来最好的。这些基准无疑是一种有效的测试方法。

    另外:我仅用我的声音就在短短两天内构建了一个 iOS 应用程序 - 它令人震惊

    但我更喜欢实践方法,因此我总是将 DPQ 基准测试作为顶级测试。你问什么是DPQ?这是大卫耐心商数基准,它是这样工作的。如果在使用模型或 AI 解决方案几天后,我达到了“frak this”阶段,则该模型未通过 DPQ。

    前几个月,Claude Code 和 OpenAI Codex 都通过了 DPQ。 Goose 与 Ollama 和 Qwen3-coder 结合,在面对更大规模的项目时,在 DPQ 上惨败。

    作业

    这就是我决定交给 Goose 及其伙伴的项目。

    准备工作