DeepSeek Coder V2：首个超越 GPT-4 Turbo 的开放编码模型 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

DeepSeek Coder V2：首个超越 GPT-4 Turbo 的开放编码模型

2024年6月18日 16:17 33 Comments

中国人工智能挑战OpenAI和Anthropic的霸主地位。

来源:安全实验室新闻频道

中国人工智能挑战OpenAI和Anthropic的霸主地位。

中国初创公司 DeepSeek 推出了 DeepSeek Coder V2 - 第一个开放式编程模型，其性能超越了封闭的类似产品 GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro，并领先于 Llama 3-70B。

提出

基于之前的 DeepSeek-V2 模型，新产品在编码和数学问题上展现了出色的结果，支持 300 多种编程语言，同时保持了较高的一般推理和语言理解能力。

DeepSeek于去年成立，其使命是“通过好奇心揭开AGI的神秘面纱”，现已成为中国人工智能市场的重要参与者，加入了商汤科技、旷视科技和百度等公司的行列。事实上，在推出后的一年内，这家初创公司已经推出了多种型号，包括 DeepSeek Coder 系列。 DeepSeek Coder的第一个版本，拥有多达330亿个参数，支持86种编程语言和16000个令牌的上下文窗口。新版本V2将支持扩展至338种语言，并将上下文窗口增加至12.8万个，让您应对更复杂的编程任务。

在旨在评估代码生成和问题解决的 MBPP+、HumanEval 和 Aider 测试中，DeepSeek Coder V2 分别得分 76.2、90.2 和 73.7 分，领先于大多数模型，包括 GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro 和 Llama-3 70B。 MATH 和 GSM8K 测试也获得了类似的结果，这些测试评估了模型的数学能力。

获得 MIT 许可您的平台

Opus Turbo V2 支持 Pro DeepSeek 模型数学 Claude 1.5 公司编程评估问题 Gemini Coder 获得 GPT 中国科技

DeepSeek Coder V2：首个超越 GPT-4 Turbo 的开放编码模型

其他外部链接

Tags

XiaoMi-AI