更新了可用于生产的 Gemini 模型,降低了 1.5 Pro 的价格,提高了速率限制等等

我们正在发布两款更新的可投入生产的 Gemini 模型

来源:DeepMind - 新闻与博客

今天,我们将发布两种更新的生产准备的Gemini型号:Gemini-1.5-Pro-002和Gemini-1.5-Flash-002以及:

gemini-1.5-pro-002 gemini-1.5-flash-002
    > 50%降低1.5 Pro的价格(提示的输入和输出<128K)2倍速率上的限制为1.5闪存的速率限制更高,在1.5 Pro2x上更快的输出和3倍延迟延迟默认过滤器设置
  • > 50%降低了1.5 Pro的价格(提示<128K的输入和输出)
  • 1.5闪存的速率限制高2倍,1.5 pro
  • 2倍输出速度和3倍延迟 更新的默认过滤器设置 这些新模型基于我们最新的实验模型发布,并包括对5月在Google I/O发布的Gemini 1.5模型的有意义的改进。开发人员可以通过Google AI Studio和Gemini API免费访问我们的最新型号。对于大型组织和Google Cloud客户,该模型也可以在Vertex AI上找到。 Google AI Studio gemini api 顶点AI 提高了整体质量,数学,长篇小说和愿景的提高
  • 2倍输出速度和3倍延迟
  • 更新的默认过滤器设置

    这些新模型基于我们最新的实验模型发布,并包括对5月在Google I/O发布的Gemini 1.5模型的有意义的改进。开发人员可以通过Google AI Studio和Gemini API免费访问我们的最新型号。对于大型组织和Google Cloud客户,该模型也可以在Vertex AI上找到。 Google AI Studio gemini api

    顶点AI

    提高了整体质量,数学,长篇小说和愿景的提高

    GEMINI 1.5系列是为在各种文本,代码和多模式任务中进行一般性能而设计的模型。例如,Gemini模型可用于合成1000页PDF的信息,回答有关包含10,000多行代码的存储库的问题,摄入一个小时的视频并从中创建有用的内容,等等。

    随着最新更新,1.5 Pro和Flash现在更好,更快且具有更高的成本效益。我们看到MMLU-Pro增长了约7%,这是流行的MMLU基准的更具挑战性的版本。关于数学和隐藏式马斯(内部竞争数学问题集)的基准,这两种模型都取得了〜20%的提高。对于视觉和代码用例,这两个模型在衡量视觉理解和Python代码生成的EVAL中的性能也更好(范围为〜2-7%)。 提示策略指南

    Gemini API模型页

    双子座1.5 Pro 长上下文窗口处理1000页PDFS