Google 发布 Computer Use - AI 可以为你点击和冲浪

谷歌发布了 Gemini 2.5 计算机使用人工智能模型,可以像人类一样导航、点击和填写表格。这不仅仅是一个回答问题的普通人工智能,而是一个可以真正控制浏览器并通过自己与用户界面交互来为你执行任务的人工智能。

来源:AI新闻
Gemini 2.5计算机使用模型是基于Gemini 2.5 PRO的视觉理解和推理能力的新型专用AI模型,旨在与用户界面进行交互。 Surveillance.google 发布了 Gemini 2.5 计算机使用人工智能模型,可以像人类一样导航、点击和填写表格。这不仅仅是一个回答问题的普通人工智能,而是一个可以真正控制浏览器并通过与您自己的用户界面交互来为您执行任务的人工智能。它可以单击按钮、编写文本、滚动、在页面之间导航,甚至操作下拉列表和过滤器等复杂元素。具体来说它能做什么?对于完全自动化的助理来说,他们可以处理从预订到购物的所有事务,而无需费力。 Google 已经开始在各种测试环境中使用此 AI 模型:UI 测试,这可以使软件开发速度显着加快。Project mariner.firebase 测试代理。Sis 是 AI:
  • Gemini 2.5计算机使用模型是基于Gemini 2.5 PRO的视觉理解和推理能力的新型专用AI模型,旨在与用户界面进行交互。
  • 该模型可以通过浏览器浏览网络并与不同的网站交互。
  • Gemini 2.5 电脑使用

    它具体能做什么?

  • 滚动和缩放页面