基于LLM的代理在软件工程中的可靠应用需要大幅度提高其偏差的准确性和最小化。虽然LLM的规模和性能继续增加,但似乎像单个代理的幻觉一样的现象是不可避免的,因为它们与生成模型中的基本推理机制相关。另一方面,证据开始积累有关通过在代理人群体之间进行协作和辩论来实现所需绩效的可能性。在人类之间发生的工作质量随着工人在任务,有组织的协作以及背景不同的工人之间的讨论而提高。与人类不同,多个必需的AI代理的实例化以及它们之间的协作和讨论非常快,便宜,这使得这种方法变得特别方便。Mosaico EU项目1提出了实施这种方法的理论和技术框架,并将其扩展到非常大的合作代理人,即ai-ai-agent社区。该项目收集了工具辅助软件工程的世界领先的专家:欧洲学术团队,著名的工具提供者(Qodo,Eclipse)和工业用户(Collins Aerospace,Immersospace,Immersion,Unparallial,NBG)。
主要关键词