专门的大型语言模型 (LLM) 的出现在解决材料科学中的复杂任务方面显示出良好的前景。然而,许多 LLM 往往难以应对材料科学任务的独特复杂性,例如计算挑战,并且严重依赖过时的隐性知识,从而导致不准确和幻觉。为了应对这些挑战,我们推出了 HoneyComb,这是第一个专为材料科学设计的基于 LLM 的代理系统。HoneyComb 利用可靠、高质量的材料科学知识库 (MatSciKB) 和专门为材料科学量身定制的复杂工具中心 (ToolHub) 来增强其推理和计算能力。MatSciKB 是基于可靠文献的精选结构化知识集合,而 ToolHub 采用归纳工具构建方法来生成、分解和细化材料科学的 API 工具。此外,HoneyComb 利用检索器模块自适应地选择适合特定任务的知识源或工具,从而确保准确性和相关性。我们的结果表明,HoneyComb 在材料科学的各种任务中的表现明显优于基线模型,有效地弥补了当前 LLM 能力与该领域的专业需求之间的差距。此外,我们的适应性框架可以轻松扩展到其他科学领域,凸显了其在推进科学研究和应用方面的广泛适用性潜力。代码可用。1
主要关键词