阿里巴巴声称其新 AI 模型比 DeepSeek 更好 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

阿里巴巴声称其新 AI 模型比 DeepSeek 更好

2025年1月31日 10:34 33 Comments

从已公布的测试结果来看，阿里巴巴Qwen 2.5-Max的表现也优于GPT-4o。

来源:OSP网站大数据新闻

中国控股公司阿里巴巴宣布发布大型语言模型 Qwen 2.5，据开发人员称，该模型的性能优于 DeepSeek V3，后者是中国一家初创公司创建的流行聊天机器人 DeepSeek 的核心模型。

Qwen 2.5 GitHub 页面包含基准测试结果，表明新模型的表现优于 GPT-4o（ChatGPT 所基于的模型）、DeepSeek-V3 和 Llama-3.1-405B，并且性能与 Anthropic 的专有模型 Claude 3.5-Sonnet 相似，Anthropic 授权该模型用于各种应用程序。

阿里巴巴的新模型不太可能像 DeepSeek V3 那样资源优化，因为 Qwen 对每个查询都使用所有参数，而 DeepSeek 仅激活与查询主题区域相关的部分。但不管怎样，DeepSeek 的发布似乎不仅震撼了全球生成式人工智能系统市场，也震撼了中国国内市场——专家认为，一些本土公司可能很快就会推出新的大型语言模型。

表明震撼 V3 开发人员优于应用程序阿里巴巴人工智能语言 DeepSeek 创建 Qwen 模型不管怎样查询市场公司授权模型的 Anthropic 发布机器人 2.5 中国

阿里巴巴声称其新 AI 模型比 DeepSeek 更好

其他外部链接

Tags

XiaoMi-AI