中国DeepSeek发布新的AI模型。它超越了美国型号

就像一场重量级的战斗一样,大型人工智能研究实验室继续在模型改进方面展开较量。

来源:营销人工智能研究所
就像一场重量级的战斗一样,大型人工智能研究实验室继续在模型改进方面展开较量。最新的攻击来自中国研究实验室 DeepSeek,该实验室凭借高性能、低成本模型多次震撼业界,推出了 DeepSeek-V3.2。根据该公司的技术报告,新版本引入了一种新颖的架构,旨在从根本上提高效率,同时保持顶级推理能力。在某些基准上,它超越了 GPT-5。为了了解 DeepSeek 是否准备再次颠覆市场,我在《人工智能秀》第 183 集中与 SmarterX 和 Marketing AI Institute 创始人兼首席执行官 Paul Roetzer 讨论了新版本。来自中国的竞赛 DeepSeek-V3.2 引入了一种名为“DeepSeek 稀疏注意力”(DSA) 的新机制。这使得该模型能够以比传统模型低得多的计算复杂性处理长信息流。其结果是一个平衡高效率和深度推理能力的系统,特别是在其他模型可能陷入困境或变得过于昂贵的“长上下文”场景中。对于 Roetzer 来说,这一发布证实了人工智能主导地位的争夺是全球性的。“显然 DeepSeek 是这方面的主要参与者,并且可以成为美国人工智能实验室模型正在做的事情的颠覆力量,”Roetzer 说。 金牌性能该版本包括两个不同的变体:标准 DeepSeek-V3.2 和名为 DeepSeek-V3.2-Speciale 的高计算版本。技术论文中概述的功能令人大开眼界:代理思维:该模型将“思维过程”直接集成到工具使用中,使其能够通过涉及使用外部软件或代码的复杂任务进行推理。GPT-5 级别推理:标准 V3.2 模型的性能与在多个推理基准测试中获得“GPT-5-High”。 金牌性能:V3.2-Speciale 在多个基准测试中超越了 GPT-5 和 Google 的 Gemini-3.0-Pro