阿里巴巴声称其新 AI 模型比 DeepSeek 更好

从已公布的测试结果来看,阿里巴巴Qwen 2.5-Max的表现也优于GPT-4o。

来源:OSP网站大数据新闻

中国控股公司阿里巴巴宣布发布大型语言模型 Qwen 2.5,据开发人员称,该模型的性能优于 DeepSeek V3,后者是中国一家初创公司创建的流行聊天机器人 DeepSeek 的核心模型。

Qwen 2.5 GitHub 页面包含基准测试结果,表明新模型的表现优于 GPT-4o(ChatGPT 所基于的模型)、DeepSeek-V3 和 Llama-3.1-405B,并且性能与 Anthropic 的专有模型 Claude 3.5-Sonnet 相似,Anthropic 授权该模型用于各种应用程序。

阿里巴巴的新模型不太可能像 DeepSeek V3 那样资源优化,因为 Qwen 对每个查询都使用所有参数,而 DeepSeek 仅激活与查询主题区域相关的部分。但不管怎样,DeepSeek 的发布似乎不仅震撼了全球生成式人工智能系统市场,也震撼了中国国内市场——专家认为,一些本土公司可能很快就会推出新的大型语言模型。