Cognition 透露 Devin 是世界上第一位完全自主的 AI 软件工程师

这家总部位于美国的初创公司的 AI 驱动工具可以使用自己的 shell、代码编辑器和 Web 浏览器解决工程任务The post Cognition Reveals Devin the World’s First Fully Autonomous AI Software Engineer appeared first on GreatAIPrompts: AI Prompts, AI Tools & AI News.

来源:GreatAIPrompts

2024 年 3 月 17 日:美国初创公司 Cognition 推出了一款人工智能工具 Devin,该公司声称这是“世界上第一个完全自主的人工智能软件工程师”。

2024 年 3 月 17 日: Cognition

Devin 旨在使用自己的 shell、代码编辑器和 Web 浏览器独立解决工程任务。

Devin AI 自主修复 GitHub 错误
Devin AI 自主修复 GitHub 错误
Devin AI 自主修复 GitHub 错误

根据 Cognition 提供的演示,Devin 可以利用其 Web 浏览器访问和学习 API 文档,从而能够插入各种 API。

视频

视频

当 AI 代理遇到错误时,它会自动在其代码编辑器界面中向主代码添加调试打印语句并重新运行代码。

Cognition 展示了 Devin 在构建和部署应用程序、识别和修复代码库中的错误,甚至微调 AI 模型方面的能力。

为了评估 Devin 的准确性,Cognition 在 SWE-bench 上测试了 AI 代理,这是一个基准测试平台,挑战代理解决 GitHub 上开源项目中发现的实际问题。

Devin 成功地端到端解决了 13.86% 的问题,超过了 GPT4(1.74%)的表现和 Anthropic 的 Claude 2(4.80%)保持的之前最佳成绩。

Devin 成功地端到端解决了 13.86% 的问题,超过了 GPT4 的表现(1.74%)和之前 Anthropic 的 Claude 2 保持的最佳得分(4.80%)。

值得注意的是,Devin 在没有帮助的情况下在存储库中定位相关文件的情况下实现了这一目标。

虽然微软提供了人工智能驱动的开发者工具,如 GitHub Copilot,它为程序员提供代码完成和辅助功能,但它无法在没有人为干预或协助的情况下端到端完成代码。

相比之下,Devin 能够自主完成编码任务。

请求早期访问 公司网站