详细内容或原文请订阅后点击阅览
介绍双子座2.5 Flash
Gemini 2.5 Flash是我们的第一个完全混合推理模型,使开发人员能够打开或关闭思考。
来源:DeepMind - 新闻与博客今天,我们将通过Google AI Studio和Vertex AI推出Gemini 2.5 Flash的早期版本。该新版本以2.0 Flash的流行基础为基础,在推理功能方面进行了重大升级,同时仍然优先考虑速度和成本。 Gemini 2.5 Flash是我们的第一个完全混合推理模型,使开发人员能够打开或关闭思考。该模型还允许开发人员设定思维预算,以找到质量,成本和延迟之间的正确权衡。即使进行思考,开发人员也可以保持2.0闪存的快速速度,并提高性能。
双子座2.5闪存 预览 Google AI Studio 顶点AI 思考,我们的双子座2.5模型正在思考模型,能够在响应之前通过思想进行推理。该模型无需立即生成输出,而是可以执行“思考”过程,以更好地理解提示,分解复杂的任务并计划响应。在需要多个推理步骤的复杂任务(例如解决数学问题或分析研究问题)上,思维过程允许模型得出更准确,更全面的答案。实际上,Gemini 2.5 Flash在LMARENA的硬提示上表现出色,仅次于2.5 Pro。
lmarena中的硬提示2.5 Flash具有与其他领先模型相当的指标,其成本和大小的一小部分。
我们最具成本效益的思维模型
2.5 Flash继续以最佳的价格与性能比率作为模型。
Gemini 2.5 Flash为Google的质量成本帕累托前沿添加了另一个型号。*
精细粒度控制以管理思维
思考预算随着思维预算的增加,推理质量的提高。
该模型经过培训,以了解在给定的提示中思考多长时间,因此自动决定基于感知的任务复杂性要思考多少。
将思维预算设置为0。 设置特定令牌预算提示要求低推理:
示例1:西班牙语中的“谢谢”
+
-
*
/ < / div>
=