帮助非专家构建先进的生成式 AI 模型

MosaicML 由麻省理工学院的一位校友和一位教授共同创立,它使深度学习模型更快、更高效。 Databricks 收购它扩大了这一使命。

来源:MIT新闻 - 人工智能

如果只有一家公司构建和控制模型(更不用说输入模型的数据),那么人工智能的影响永远不会是公平的。不幸的是,当今的人工智能模型由数十亿个参数组成,必须对这些参数进行训练和调整才能最大限度地提高每个用例的性能,这使得最强大的人工智能模型对于大多数人和公司来说都遥不可及。

MosaicML 的使命是让这些模型更容易获得。该公司的联合创始人包括 Jonathan Frankle PhD '23 和麻省理工学院副教授 Michael Carbin,他们开发了一个平台,让用户使用自己的数据训练、改进和监控开源模型。该公司还使用 Nvidia 的图形处理单元 (GPU) 构建了自己的开源模型。

随着 Chat GPT-3.5 发布后,人们对生成式人工智能和大型语言模型 (LLM) 的兴趣激增,这种方法让深度学习(MosaicML 刚开始时还是一个新兴领域)可以被更多组织所接受。这也使 MosaicML 成为数据管理公司的强大补充工具,这些公司也致力于帮助组织利用他们的数据,而无需将其交给 AI 公司。

去年,这种推理导致 Databricks 收购了 MosaicML,Databricks 是一家全球数据存储、分析和 AI 公司,与世界上一些最大的组织合作。 自收购以来,合并后的公司发布了迄今为止性能最高的开源通用 LLM 之一。 该模型被称为 DBRX,在阅读理解、常识问题和逻辑谜题等任务中设定了新的基准。

从那时起,DBRX 就以最快的开源 LLM 之一而闻名,并且已被证明在大型企业中特别有用。

使算法高效

使算法高效 论文

开源创新

开源创新