Gemini 开辟新天地:更快的模型、更长的上下文和 AI 代理

我们将在 Gemini 系列模型中推出一系列更新,包括新的 1.5 Flash(我们针对速度和效率的轻量级模型)和 Project Astra(我们对人工智能助手未来的愿景)。

来源:DeepMind - 新闻与博客

1.5 Flash 擅长摘要、聊天应用程序、图像和视频字幕、从长文档和表格中提取数据等。这是因为它通过 1.5 Pro 通过一个称为“蒸馏”的过程进行了训练,其中来自较大模型的最基本知识和技能被转移到较小、更高效的模型中。

在 Gemini 技术页面上,阅读我们更新的 Gemini 1.5 技术报告中有关 1.5 Flash 的更多信息,并了解 1.5 Flash 的可用性和定价。

Gemini 1.5 技术报告 Gemini 技术页面 1.5 Flash 的可用性和定价

显著改进 1.5 Pro

在过去几个月中,我们显著改进了 1.5 Pro,这是我们在各种任务中总体表现最好的模型。

除了将其上下文窗口扩展到 200 万个标记之外,我们还通过数据和算法的进步增强了其代码生成、逻辑推理和规划、多轮对话以及音频和图像理解。我们看到这些任务的公共和内部基准测试都有了显著的改进。

1.5 Pro 现在可以遵循越来越复杂和细致入微的指令,包括指定涉及角色、格式和样式的产品级行为的指令。我们改进了对特定用例的模型响应的控制,例如制作聊天代理的角色和响应样式或通过多个函数调用自动化工作流程。我们还让用户能够通过设置系统指令来控制模型行为。

系统指令

我们在 Gemini API 和 Google AI Studio 中添加了音频理解,因此 1.5 Pro 现在可以对在 Google AI Studio 中上传的视频的图像和音频进行推理。我们现在正在将 1.5 Pro 集成到 Google 产品中,包括 Gemini Advanced 和 Workspace 应用。在我们更新的 Gemini 1.5 技术报告和 Gemini 技术页面上了解有关 1.5 Pro 的更多信息。

Gemini API Google AI Studio Gemini Advanced Workspace Gemini 1.5 技术报告 Gemini 技术页面 Android 上的 Gemini 1.0 Nano