大型语言模型 (LLM) 的快速发展彻底改变了人工智能,在自然语言处理和多模态内容生成方面引入了前所未有的能力。然而,这些模型的复杂性和规模不断增加,催生了多方面的供应链,对基础设施、基础模型和下游应用提出了独特的挑战。本文提供了 LLM 供应链的第一个全面研究议程,提供了一种结构化的方法,通过软件工程 (SE) 和安全与隐私 (S&P) 的双重视角来识别关键挑战和机遇。我们首先对 LLM 供应链进行明确的定义,包括其组件和依赖关系。然后,我们分析供应链的每一层,提出稳健和安全的 LLM 开发的愿景,回顾当前的实践和技术状况,并确定关键挑战和研究机会。这项工作旨在弥补现有的研究空白,系统地了解 LLM 供应链中的多方面问题,提供宝贵的见解,以指导未来在这个快速发展的领域的努力。
主要关键词