将于今年夏天发布的开源瑞士语言模型

Wes Cockx&Google DeepMind / AI大型语言模型 /由CC-BY 4.0许可,由Melissa Anchisi和Florian Meyer今年夏天,EPFL和Eth Zurich将发布公共基础设施的大型语言模型(LLM)。在瑞士国家超级计算中心(CSC)的“阿尔卑斯山”超级计算机上接受培训,新的LLM标记了[…]

来源:ΑΙhub

Wes Cockx&Google DeepMind / AI大型语言模型 / CC-BY 4.0 < / div>许可

wes cockx Google DeepMind AI大语言模型 由CC-BY 4.0

Melissa Anchisi和Florian Meyer

今年夏天,EPFL和ETH苏黎世将发布有关公共基础设施开发的大型语言模型(LLM)。在瑞士国家超级计算中心(CSCS)的“阿尔卑斯山”超级计算机上接受培训,新的LLM标志着开源AI和多语言卓越的里程碑。

本月早些时候在日内瓦,大约有50项全球领先的计划和组织致力于开源LLMS和值得信赖的AI,在国际开放式LLM LLM Builders Summit召集。该活动由EPFL和Eth Zurich的AI中心主办,标志着为开放基础模型建立充满活力和协作的国际生态系统的重要一步。开放LLM越来越被视为商业系统的可靠替代品,其中大多数是在美国或中国闭门造车后面开发的。

峰会的参与者预览了即将发布的全面开放,公开开发的LLM,这是由EPFL,Eth Zurich和其他瑞士大学的研究人员共同创建的,与CSC的工程师密切合作。目前,在最终测试中,该模型将在开放许可下下载。该模型着重于透明度,多语言性能和广泛的可访问性。

该模型将完全开放:源代码和权重将是公开可用的,培训数据将是透明且可重复的,可以支持科学,政府,教育和私营部门的采用。这种方法旨在促进创新和问责制。

多语言设计

LLM的独特特征是其具有1000多种语言的能力。 Antoine Bosselut说:“我们从一开始就强调了大量多语言的模型。”

专为刻度和包容>

负责的数据实践

最近的研究

超级计算机作为主权AI