Cognition 透露 Devin 是世界上第一位完全自主的 AI 软件工程师

这家总部位于美国的初创公司的 AI 驱动工具可以使用自己的 shell、代码编辑器和 Web 浏览器解决工程任务文章 Cognition 揭示 Devin 是世界上第一位完全自主的 AI 软件工程师,最先出现在 Weam - AI For Digital Agency 上。

来源:GreatAIPrompts

2024年3月17日:美国启动Devin引入了美国的初创企业认知,这是该公司声称的AI驱动工具,是“世界上第一位完全自主的AI软件工程师”。

2024年3月17日: 认知

Devin旨在使用自己的外壳,代码编辑器和Web浏览器独立解决工程任务。

devin ai修复github bugs自主

根据认知提供的演示,Devin可以利用其Web浏览器访问和从API文档中学习,从而使其能够插入各种API。

https://youtu.be/fjhtjt7go1c 当AI代理遇到错误时,它会在其代码编辑器接口中的主代码中自动添加调试打印语句并重新运行代码。 认知已展示了Devin在构建和部署应用程序,识别和修复代码库中的错误,甚至对AI模型进行微调的功能。 为了评估Devin的准确性,认知在SWE Bench上测试了AI代理,这是一个基准测试平台,挑战代理商以解决Github上开源项目中发现的现实世界问题。 Devin成功解决了端到端问题的13.86%,超过了GPT4的表现(1.74%),而人类的Claude 2(4.80%)持有的先前最佳分数。 值得注意的是,Devin在没有协助的情况下在存储库中找到相关文件实现了这一目标。 Microsoft提供了AI驱动的开发人员工具,例如Github Copilot,该工具为程序员提供代码完成和辅助功能,但如果没有人类干扰或帮助,它就无法端到端完成代码。 相比之下,Devin能够自主完成编码任务。 认知目前正在为希望利用AI代理进行工程工作的企业提供早期访问Devin的机会。有兴趣的客户可以通过公司的网站要求尽早访问。 请求早期访问 公司的网站

https://youtu.be/fjhtjt7go1c

当AI代理遇到错误时,它会在其代码编辑器接口中的主代码中自动添加调试打印语句并重新运行代码。

认知已展示了Devin在构建和部署应用程序,识别和修复代码库中的错误,甚至对AI模型进行微调的功能。

为了评估Devin的准确性,认知在SWE Bench上测试了AI代理,这是一个基准测试平台,挑战代理商以解决Github上开源项目中发现的现实世界问题。

Devin成功解决了端到端问题的13.86%,超过了GPT4的表现(1.74%),而人类的Claude 2(4.80%)持有的先前最佳分数。

值得注意的是,Devin在没有协助的情况下在存储库中找到相关文件实现了这一目标。 Microsoft提供了AI驱动的开发人员工具,例如Github Copilot,该工具为程序员提供代码完成和辅助功能,但如果没有人类干扰或帮助,它就无法端到端完成代码。 相比之下,Devin能够自主完成编码任务。 认知目前正在为希望利用AI代理进行工程工作的企业提供早期访问Devin的机会。有兴趣的客户可以通过公司的网站要求尽早访问。 请求早期访问 公司的网站

值得注意的是,Devin在没有协助的情况下在存储库中找到相关文件实现了这一目标。

Microsoft提供了AI驱动的开发人员工具,例如Github Copilot,该工具为程序员提供代码完成和辅助功能,但如果没有人类干扰或帮助,它就无法端到端完成代码。

相比之下,Devin能够自主完成编码任务。 认知目前正在为希望利用AI代理进行工程工作的企业提供早期访问Devin的机会。有兴趣的客户可以通过公司的网站要求尽早访问。请求早期访问公司的网站