中国DeepSeek发布新的AI模型。它超越了美国型号 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

中国DeepSeek发布新的AI模型。它超越了美国型号

2025年12月5日 13:30 33 Comments

就像一场重量级的战斗一样，大型人工智能研究实验室继续在模型改进方面展开较量。

来源:营销人工智能研究所

就像一场重量级的战斗一样，大型人工智能研究实验室继续在模型改进方面展开较量。最新的攻击来自中国研究实验室 DeepSeek，该实验室凭借高性能、低成本模型多次震撼业界，推出了 DeepSeek-V3.2。根据该公司的技术报告，新版本引入了一种新颖的架构，旨在从根本上提高效率，同时保持顶级推理能力。在某些基准上，它超越了 GPT-5。为了了解 DeepSeek 是否准备再次颠覆市场，我在《人工智能秀》第 183 集中与 SmarterX 和 Marketing AI Institute 创始人兼首席执行官 Paul Roetzer 讨论了新版本。来自中国的竞赛 DeepSeek-V3.2 引入了一种名为“DeepSeek 稀疏注意力”(DSA) 的新机制。这使得该模型能够以比传统模型低得多的计算复杂性处理长信息流。其结果是一个平衡高效率和深度推理能力的系统，特别是在其他模型可能陷入困境或变得过于昂贵的“长上下文”场景中。对于 Roetzer 来说，这一发布证实了人工智能主导地位的争夺是全球性的。“显然 DeepSeek 是这方面的主要参与者，并且可以成为美国人工智能实验室模型正在做的事情的颠覆力量，”Roetzer 说。金牌性能该版本包括两个不同的变体：标准 DeepSeek-V3.2 和名为 DeepSeek-V3.2-Speciale 的高计算版本。技术论文中概述的功能令人大开眼界：代理思维：该模型将“思维过程”直接集成到工具使用中，使其能够通过涉及使用外部软件或代码的复杂任务进行推理。GPT-5 级别推理：标准 V3.2 模型的性能与在多个推理基准测试中获得“GPT-5-High”。金牌性能：V3.2-Speciale 在多个基准测试中超越了 GPT-5 和 Google 的 Gemini-3.0-Pro

中国DeepSeek发布新的AI模型。它超越了美国型号

其他外部链接

Tags

XiaoMi-AI