Gemini 2.5 Flash-lite现在准备好用于缩放生产

gemini 2.5闪光灯以前在预览中,现在稳定并且通常可用。这种具有成本效益的模型可提供较小尺寸的高质量,其中包括2.5个家庭功能,例如100万台上下文窗口和多模式。

来源:DeepMind - 新闻与博客

今天,我们将在Gemini 2.5型号系列中发布稳定版本的Gemini 2.5 2.5 Flash-Lite,我们最快,最低的成本(每1m $ 0.10输入,每100万美元的输出$ 0.40)。我们构建了2.5闪存的闪光灯,以推动每一美元的智能边界,其本地推理功能可以选择地为更苛刻的用例打开。该模型以2.5 Pro和2.5 Flash的动量为基础,将我们准备用于缩放生产使用的2.5型型号。

我们最具成本效益和最快的2.5型

Gemini 2.5 Flash-Lite在性能和成本之间取得了平衡,而不会损害质量,尤其是对于延迟敏感的任务,例如翻译和分类。

这是使它脱颖而出的原因:

    最佳的课堂速度:Gemini 2.5闪光灯延迟低于2.0 Flash-lite和2.0闪存,在广泛的提示样本中。
最佳课堂速度:
    成本效率:这是我们迄今为止最低的2.5型型号,价格为0.10 / 100万美元,输入令牌和0.40美元的输出令牌,使您可以负担得起大量的请求。从预览发布开始,我们还将音频输入定价降低了40%。
成本效率:
    智能和小:它在广泛的基准测试中表现出比2.0闪光灯的全能质量,包括编码,数学,科学,推理和多模式理解。
智能和小:
    充分出色:当您使用2.5 Flash-lite构建时,您可以访问100万个to的上下文窗口,可控的思维预算以及对Google搜索,代码执行和URL上下文等本机工具等本机工具的支持。
完全特色:

gemini 2.5 flash-lite行动

自2.5 Flash-Lite推出以来,我们已经看到了一些非常成功的部署,这是我们的最爱:

satlyt 2.5 Flash-Lite的速度使延迟降低了45% 功耗下降30% heygen 将视频转换为180多种语言 docshound 处理长视频并提取数千个屏幕截图 Evertune Google AI Studio