apertus:完全开放,透明,多语言模型

由Melissa Anchisi和Florian Meyer于7月,EPFL,Eth Zurich和瑞士国家超级计算中心(CSC)宣布了他们建立大型语言模型(LLM)的联合计划。现在,该模型可以使用,并为开发人员和组织提供诸如聊天机器人,翻译系统或教育工具等应用程序的基础。 […]

来源:Robohub

Melissa Anchisi和Florian Meyer

在7月,EPFL,ETH苏黎世和瑞士国家超级计算中心(CSC)宣布了共同的倡议,以建立大型语言模型(LLM)。现在,该模型可以使用,并为开发人员和组织提供诸如聊天机器人,翻译系统或教育工具等应用程序的基础。

他们的共同计划建立大型语言模型(LLM)

该模型被命名为“ Apertus” - 拉丁语“打开” - 突出显示其独特的功能:整个开发过程,包括其体系结构,模型权重,培训数据和食谱,公开易于访问且充分记录。

apertus

AI研究人员,专业人士和经验丰富的爱好者可以通过战略合作伙伴Swisscom访问该模型,也可以从拥抱面(AI)Face(用于AI模型和应用程序的平台)中下载它,并将其部署为自己的项目。 Apertus有两种尺寸可免费使用 - 具有80亿和700亿个参数,较小的模型更适合个人使用。这两种模型均在允许的开源许可下发布,允许在教育和研究中使用以及广泛的社会和商业应用。

拥抱脸

完全开源的LLM

作为一种完全开放的语言模型,Apertus允许研究人员,专业人士和爱好者以模型为基础,并根据其特定需求以及检查培训过程的任何部分。这将Apertus与仅使所选组件可访问的模型区分开。

“通过此版本,我们旨在为如何开发一个值得信赖,主权和包容性的AI模型提供蓝图,” EPFL机器学习教授,瑞士AI倡议的指导委员会成员Martin Jaggi说。开发团队将定期更新该模型,其中包括专业工程师以及来自CSCS,Eth Zurich和EPFL的大量研究人员。

创新驱动程序

可访问性

EPFL