更新苹果的设备和服务器基础语言模型

凭借苹果智能,我们将强大的生成AI融入到应用程序中,并在保护其隐私的同时每天都会使用人们使用。在2025年全球开发人员会议上,我们引入了新一代语言基础模型,专门为增强我们最新软件发行的Apple Intelligence功能而开发。我们还介绍了新的基础模型框架,该框架使应用程序开发人员可以直接访问Apple Intelligence核心的设备基础语言模型。我们精心制作了这些生成模型,为…

来源:Apple机器学习研究

凭借苹果智能,我们将强大的生成AI融入到应用程序中,并在保护其隐私的同时每天都会使用人们使用。在2025年全球开发人员会议上,我们引入了新一代语言基础模型,专门为增强我们最新软件发行的Apple Intelligence功能而开发。我们还介绍了新的基础模型框架,该框架使应用程序开发人员可以直接访问Apple Intelligence的核心核心基础语言模型。

我们制定了这些生成模型,为整个平台集成的广泛智能功能提供动力。这些模型具有改进的工具使用和推理功能,了解图像和文本输入,更快,更有效,旨在支持15种语言。我们最新的基础模型经过优化,可以在Apple Silicon上有效运行,并包括一个紧凑的大约30亿参数模型,以及基于Experts服务器的混合模型,以及针对私有云计算的新型体系结构。这两个基础模型是苹果为支持我们的用户而创建的较大生成模型系列的一部分。

私人云计算

在此概述中,我们详细介绍了我们设计的模型的体系结构,用于培训的数据,我们使用的培训配方,用于优化推理的技术以及与可比模型相比,我们用来优化推理的技术以及我们的评估结果。在整个过程中,我们强调了如何实现功能和质量改进的扩展,同时提高了速度和效率,并在私有云计算上。最后,在我们继续致力于维护我们的核心价值观的过程中,我们说明了负责AI原则如何在整个模型开发过程中集成。

图1:对Apple基础模型的建模概述。

模型体系结构

图2

培训数据

文本数据

图像数据

我们策划了多种类型的图像文本数据:

表,图表和图