详细内容或原文请订阅后点击阅览
Google 新的 Gemini 3 “vibe-codes” 响应并带有自己的代理
Google 今天推出了 Gemini 3,这是对其旗舰多式联运模型的重大升级。该公司表示,新模型的推理能力更强,具有更流畅的多模式功能(跨语音、文本或图像工作的能力),并且将像代理一样工作。之前的型号 Gemini 2.5 支持多模式输入。用户可以喂它...
来源:MIT Technology Review _人工智能“视觉布局生成了带有照片和模块的沉浸式杂志风格视图,”Google 实验室、Gemini 和 AI Studio 副总裁 Josh Woodward 说道。 “这些元素不仅看起来不错,而且还邀请您的意见来进一步定制结果。”
在 Gemini 3 中,Google 还推出了 Gemini Agent,这是一项实验性功能,旨在直接在应用程序内处理多步骤任务。该代理可以连接到 Google 日历、Gmail 和提醒等服务。一旦获得访问权限,它就可以执行组织收件箱或管理日程表等任务。
与其他代理类似,它将任务分解为离散的步骤,实时显示其进度,并在继续之前暂停以等待用户批准。谷歌将该功能描述为迈向“真正的多面手代理”的一步。从 11 月 18 日起,美国的 Google AI Ultra 订阅者即可在网络上使用该服务。
整体方法看起来很像“vibe 编码”,用户用简单的语言描述最终目标,并让模型组装实现目标所需的界面或代码。
此次更新还将 Gemini 与 Google 现有产品更深入地联系在一起。在搜索中,少数 Google AI Pro 和 Ultra 订阅者现在可以切换到 Gemini 3 Pro(新模型的推理变体),以获得更深入、更彻底的 AI 生成的摘要,这些摘要依赖于模型的推理而不是现有的 AI 模式。
