Gemini 2.5 Flash-lite现在准备好用于缩放生产 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

Gemini 2.5 Flash-lite现在准备好用于缩放生产

2025年7月22日 16:00 33 Comments

gemini 2.5闪光灯以前在预览中，现在稳定并且通常可用。这种具有成本效益的模型可提供较小尺寸的高质量，其中包括2.5个家庭功能，例如100万台上下文窗口和多模式。

来源:DeepMind - 新闻与博客

今天，我们将在Gemini 2.5型号系列中发布稳定版本的Gemini 2.5 2.5 Flash-Lite，我们最快，最低的成本（每1m $ 0.10输入，每100万美元的输出$ 0.40）。我们构建了2.5闪存的闪光灯，以推动每一美元的智能边界，其本地推理功能可以选择地为更苛刻的用例打开。该模型以2.5 Pro和2.5 Flash的动量为基础，将我们准备用于缩放生产使用的2.5型型号。

我们最具成本效益和最快的2.5型

Gemini 2.5 Flash-Lite在性能和成本之间取得了平衡，而不会损害质量，尤其是对于延迟敏感的任务，例如翻译和分类。

这是使它脱颖而出的原因：

最佳的课堂速度：Gemini 2.5闪光灯延迟低于2.0 Flash-lite和2.0闪存，在广泛的提示样本中。 最佳课堂速度：

成本效率：这是我们迄今为止最低的2.5型型号，价格为0.10 / 100万美元，输入令牌和0.40美元的输出令牌，使您可以负担得起大量的请求。从预览发布开始，我们还将音频输入定价降低了40％。 成本效率：

智能和小：它在广泛的基准测试中表现出比2.0闪光灯的全能质量，包括编码，数学，科学，推理和多模式理解。 智能和小：

充分出色：当您使用2.5 Flash-lite构建时，您可以访问100万个to的上下文窗口，可控的思维预算以及对Google搜索，代码执行和URL上下文等本机工具等本机工具的支持。 完全特色：

gemini 2.5 flash-lite行动

自2.5 Flash-Lite推出以来，我们已经看到了一些非常成功的部署，这是我们的最爱：

satlyt 2.5 Flash-Lite的速度使延迟降低了45％ 功耗下降30％ heygen 将视频转换为180多种语言 docshound 处理长视频并提取数千个屏幕截图 Evertune Google AI Studio

延迟最佳的推理 Flash 成本效益本机成本闪存使用的质量闪光灯速度工具的输入最低的 100 多模式 Lite 视频 lite 型号系列 Gemini 2.0 可控的敏感的音频输入广泛的大量的发布课堂 2.5