apertus：完全开放，透明，多语言模型 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

apertus：完全开放，透明，多语言模型

2025年9月11日 10:23 33 Comments

由Melissa Anchisi和Florian Meyer于7月，EPFL，Eth Zurich和瑞士国家超级计算中心（CSC）宣布了他们建立大型语言模型（LLM）的联合计划。现在，该模型可以使用，并为开发人员和组织提供诸如聊天机器人，翻译系统或教育工具等应用程序的基础。 […]

来源:Robohub

Melissa Anchisi和Florian Meyer

在7月，EPFL，ETH苏黎世和瑞士国家超级计算中心（CSC）宣布了共同的倡议，以建立大型语言模型（LLM）。现在，该模型可以使用，并为开发人员和组织提供诸如聊天机器人，翻译系统或教育工具等应用程序的基础。

他们的共同计划建立大型语言模型（LLM）

该模型被命名为“ Apertus” - 拉丁语“打开” - 突出显示其独特的功能：整个开发过程，包括其体系结构，模型权重，培训数据和食谱，公开易于访问且充分记录。

apertus

AI研究人员，专业人士和经验丰富的爱好者可以通过战略合作伙伴Swisscom访问该模型，也可以从拥抱面（AI）Face（用于AI模型和应用程序的平台）中下载它，并将其部署为自己的项目。 Apertus有两种尺寸可免费使用 - 具有80亿和700亿个参数，较小的模型更适合个人使用。这两种模型均在允许的开源许可下发布，允许在教育和研究中使用以及广泛的社会和商业应用。

拥抱脸

完全开源的LLM

作为一种完全开放的语言模型，Apertus允许研究人员，专业人士和爱好者以模型为基础，并根据其特定需求以及检查培训过程的任何部分。这将Apertus与仅使所选组件可访问的模型区分开。

“通过此版本，我们旨在为如何开发一个值得信赖，主权和包容性的AI模型提供蓝图，” EPFL机器学习教授，瑞士AI倡议的指导委员会成员Martin Jaggi说。开发团队将定期更新该模型，其中包括专业工程师以及来自CSCS，Eth Zurich和EPFL的大量研究人员。

创新驱动程序

可访问性

EPFL

培训访问较小的体系结构委员会合作伙伴独特的使用包括 LLM 全开放的语言模型开发 EPFL 机器学习瑞士允许的丰富的商业应用开放的开发人员应用程序开源自己的包容性 Apertus 共同的计算中心驱动程序研究人员动程序工程师倡议广泛的 AI 模型权重根据机器人过程