小型语言模型：2025 年 10 项突破性技术 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

小型语言模型：2025 年 10 项突破性技术

2025年1月3日 13:00 33 Comments

谁艾伦人工智能研究所、Anthropic、谷歌、Meta、微软、OpenAI 什么时候现在别搞错了：规模在人工智能世界中很重要。当 OpenAI 在 2020 年推出 GPT-3 时，它是有史以来最大的语言模型。该公司表明，超大这种类型的模型足以使性能飞速提升。那……

来源:MIT Technology Review _人工智能

目前，大多数大型科技公司都为此目的推出了旗舰模型的趣味版：OpenAI 提供 GPT-4o 和 GPT-4o mini；Google DeepMind 有 Gemini Ultra 和 Gemini Nano；Anthropic 的 Claude 3 有三种版本：超大 Opus、中型 Sonnet 和微型 Haiku。微软正在率先推出一系列名为 Phi 的小型语言模型。

越来越多的小公司也提供小型模型。人工智能初创公司 Writer 声称，其最新的语言模型在许多关键指标上的表现与最大的顶级模型相当，尽管在某些情况下，其参数数量只有最大的 20 分之一（这些参数在训练期间计算并决定模型的行为方式）。

探索 2025 年十大突破性技术的完整列表。

探索 2025 年十大突破性技术的完整列表。 探索 2025 年十大突破性技术的完整列表。 2025 年十大突破性技术列表

较小的模型效率更高，训练和运行速度更快。对于任何想要更实惠的入口的人来说，这都是个好消息。这对气候也有好处：由于较小的模型只需要其巨型表亲所需的计算机能力的一小部分，因此它们消耗的能量更少。

这些小型模型也便于携带：它们可以直接在我们的口袋里运行，而无需向云端发送请求。小型化是下一个大趋势。

小型化一系列下一个 4o 发送计算机人工智能无需模型推出公司突破性模型的运行速度 2025 云端请求 Gemini 参数 GPT 列表十大技术的

小型语言模型：2025 年 10 项突破性技术

其他外部链接

Tags

XiaoMi-AI