详细内容或原文请订阅后点击阅览
apertus:完全开放,透明,多语言模型
由Melissa Anchisi和Florian Meyer于7月,EPFL,Eth Zurich和瑞士国家超级计算中心(CSC)宣布了他们建立大型语言模型(LLM)的联合计划。现在,该模型可以使用,并为开发人员和组织提供诸如聊天机器人,翻译系统或教育工具等应用程序的基础。 […]
来源:RobohubMelissa Anchisi和Florian Meyer
在7月,EPFL,ETH苏黎世和瑞士国家超级计算中心(CSC)宣布了共同的倡议,以建立大型语言模型(LLM)。现在,该模型可以使用,并为开发人员和组织提供诸如聊天机器人,翻译系统或教育工具等应用程序的基础。
他们的共同计划建立大型语言模型(LLM)该模型被命名为“ Apertus” - 拉丁语“打开” - 突出显示其独特的功能:整个开发过程,包括其体系结构,模型权重,培训数据和食谱,公开易于访问且充分记录。
apertusAI研究人员,专业人士和经验丰富的爱好者可以通过战略合作伙伴Swisscom访问该模型,也可以从拥抱面(AI)Face(用于AI模型和应用程序的平台)中下载它,并将其部署为自己的项目。 Apertus有两种尺寸可免费使用 - 具有80亿和700亿个参数,较小的模型更适合个人使用。这两种模型均在允许的开源许可下发布,允许在教育和研究中使用以及广泛的社会和商业应用。
拥抱脸完全开源的LLM
作为一种完全开放的语言模型,Apertus允许研究人员,专业人士和爱好者以模型为基础,并根据其特定需求以及检查培训过程的任何部分。这将Apertus与仅使所选组件可访问的模型区分开。
“通过此版本,我们旨在为如何开发一个值得信赖,主权和包容性的AI模型提供蓝图,” EPFL机器学习教授,瑞士AI倡议的指导委员会成员Martin Jaggi说。开发团队将定期更新该模型,其中包括专业工程师以及来自CSCS,Eth Zurich和EPFL的大量研究人员。