详细内容或原文请订阅后点击阅览
帮助 AI 代理进行搜索,从大型语言模型中获得最佳结果
EnCompass 通过回溯和多次尝试来执行 AI 代理程序,找到 LLM 生成的最佳输出集。它可以帮助程序员更有效地与人工智能代理合作。
来源:MIT新闻 - 人工智能无论您是集思广益研究想法的科学家,还是希望实现人力资源或财务任务自动化的首席执行官,您都会发现人工智能工具正在成为您不知道自己需要的助手。特别是,许多专业人士正在利用称为人工智能代理的半自主软件系统的才能,该系统可以在特定点调用人工智能来解决问题并完成任务。
AI 代理在使用大型语言模型 (LLM) 时特别有效,因为这些系统功能强大、高效且适应性强。对此类技术进行编程的一种方法是在代码中描述您希望系统执行的操作(“工作流程”),包括何时应使用 LLM。如果您是一家软件公司,试图改造旧代码库以使用更现代的编程语言来实现更好的优化和安全性,那么您可能会构建一个系统,使用 LLM 一次翻译一个文件的代码库,并在运行时测试每个文件。
但是当法学硕士犯错误时会发生什么?您将希望代理回溯以进行另一次尝试,并吸收从之前的错误中吸取的教训。对其进行编码可能需要与实现原始代理一样多的工作;如果您的代码库翻译系统包含数千行代码,那么您将进行数千行代码更改或添加,以支持法学硕士犯错误时回溯的逻辑。
为了节省程序员的时间和精力,麻省理工学院计算机科学与人工智能实验室 (CSAIL) 和 Asari AI 的研究人员开发了一个名为“EnCompass”的框架。
分支
然后,您可以指定 EnCompass 用于导航该故事游戏的策略,以寻找故事的最佳结局。这可以包括启动并行执行线程或在陷入死胡同时回溯到先前的分支点。
EnCompass的编码效率
