Google 的 AI 智能新巅峰

谷歌推出了迄今为止最先进的人工智能模型 Gemini 3,以及新的代理优先平台 Antigravity,让人工智能能够自主规划和执行复杂的任务。它们共同通过增强的推理和多模式功能提升学习、编码和工作流程自动化。

来源:Qudata

Google 的 AI 智能新巅峰

Google 不只是迭代;它正在定义下一个计算时代。继量子回声等重大突破之后,这家科技巨头再次成为人们关注的焦点。此次,谷歌同步推出了迄今为止最智能、最强大的人工智能模型Gemini 3,以及开创性的代理开发平台Google Antigravity。总之,这些创新将从根本上改变用户与人工智能交互的方式,无论他们是学习复杂的学科、编写代码还是管理高度困难的多步骤工作流程。

量子回声等重大突破 Gemini 3,最智能、最强大的人工智能模型 Google Antigravity – 开创性的代理开发平台

Gemini 3 以 Gemini 1 和 2 为基础,将多模态理解、高级推理和代理功能结合到一个强大的单一模型中。谷歌将其描述为一种先进的人工智能,能够以惊人的细微差别和深度理解文本、图像、视频、音频和代码。

Gemini 3 在一系列 AI 基准测试中的主要亮点:

    无与伦比的推理性能:Gemini 3 Pro 以 1501 Elo 的成绩荣登 LMArena 排行榜榜首,并在 Humanity’s Last Exam (37.5%) 和 GPQA Diamond (91.9%) 上展示了博士级推理能力。高级多模态理解:在 MMMU-Pro 上得分 81%,在 Video-MMMU 上得分 87.6%,在 SimpleQA 上得分 72.1% 经过事实验证准确性。增强的代理和振动编码:Gemini 3 在零样本编码和复杂 Web 开发方面表现出色,超越 WebDev Arena (1487 Elo),并在测试模型生成代码能力的 SWE-bench Verified 上得分 76.2%。 Deep Think 模式:对于高级推理任务,Deep Think 进一步提升性能,在 Humanity 的期末考试中取得 41% 的成绩,在 GPQA Diamond 上取得 93.8% 的成绩。
  • 高级多模态理解:在 MMMU-Pro 上得分 81%,在 Video-MMMU 上得分 87.6%,在 SimpleQA 上得分 72.1% 事实准确性验证。