介绍 Gemini 2.5 计算机使用模型

我们的计算机使用模型是一个基于 Gemini 2.5 Pro 功能构建的专用模型,可通过 API 提供预览版,为可与用户界面交互的代理提供支持。

来源:DeepMind - 新闻与博客

我们如何实现安全

我们相信,建立让所有人受益的代理的唯一方法就是从一开始就负责任。控制计算机的人工智能代理会带来独特的风险,包括用户故意误用、意外的模型行为以及网络环境中的提示注入和诈骗。因此,谨慎实施安全护栏至关重要。

我们已将安全功能直接训练到模型中,以解决这三个关键风险(在 Gemini 2.5 计算机使用系统卡中进行了描述)。

Gemini 2.5电脑使用系统卡

此外,我们还为开发人员提供安全控制,使开发人员能够防止模型自动完成潜在的高风险或有害操作。这些操作的示例包括损害系统的完整性、损害安全性、绕过验证码或控制医疗设备。控件:

    每步安全服务:模型外的推理时安全服务,在执行之前评估模型提出的每个操作。系统指令:开发人员可以进一步指定代理在采取特定类型的高风险操作之前拒绝或要求用户确认。 (文档中的示例)。
  • 每步安全服务:一种模型外推理时安全服务,用于在执行模型建议的每个操作之前对其进行评估。
  • 每步安全服务:
  • 系统说明:开发人员可以进一步指定代理在采取特定类型的高风险操作之前拒绝或要求用户确认。 (文档中的示例)。
  • 系统说明: 文档

    为开发人员提供的有关安全措施和最佳实践的其他建议可以在我们的文档中找到。虽然这些保护措施旨在降低风险,但我们敦促所有开发人员在发布之前彻底测试其系统。