详细内容或原文请订阅后点击阅览
小型语言模型:2025 年 10 项突破性技术
谁 艾伦人工智能研究所、Anthropic、谷歌、Meta、微软、OpenAI 什么时候 现在 别搞错了:规模在人工智能世界中很重要。当 OpenAI 在 2020 年推出 GPT-3 时,它是有史以来最大的语言模型。该公司表明,超大这种类型的模型足以使性能飞速提升。那……
来源:MIT Technology Review _人工智能目前,大多数大型科技公司都为此目的推出了旗舰模型的趣味版:OpenAI 提供 GPT-4o 和 GPT-4o mini;Google DeepMind 有 Gemini Ultra 和 Gemini Nano;Anthropic 的 Claude 3 有三种版本:超大 Opus、中型 Sonnet 和微型 Haiku。微软正在率先推出一系列名为 Phi 的小型语言模型。
越来越多的小公司也提供小型模型。人工智能初创公司 Writer 声称,其最新的语言模型在许多关键指标上的表现与最大的顶级模型相当,尽管在某些情况下,其参数数量只有最大的 20 分之一(这些参数在训练期间计算并决定模型的行为方式)。
探索 2025 年十大突破性技术的完整列表。
探索 2025 年十大突破性技术的完整列表。 探索 2025 年十大突破性技术的完整列表。 2025 年十大突破性技术列表较小的模型效率更高,训练和运行速度更快。对于任何想要更实惠的入口的人来说,这都是个好消息。这对气候也有好处:由于较小的模型只需要其巨型表亲所需的计算机能力的一小部分,因此它们消耗的能量更少。
这些小型模型也便于携带:它们可以直接在我们的口袋里运行,而无需向云端发送请求。小型化是下一个大趋势。