DeepSeek Coder V2:首个超越 GPT-4 Turbo 的开放编码模型

中国人工智能挑战OpenAI和Anthropic的霸主地位。

来源:安全实验室新闻频道

中国人工智能挑战OpenAI和Anthropic的霸主地位。

中国初创公司 DeepSeek 推出了 DeepSeek Coder V2 - 第一个开放式编程模型,其性能超越了封闭的类似产品 GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro,并领先于 Llama 3-70B。

提出

基于之前的 DeepSeek-V2 模型,新产品在编码和数学问题上展现了出色的结果,支持 300 多种编程语言,同时保持了较高的一般推理和语言理解能力。

DeepSeek于去年成立,其使命是“通过好奇心揭开AGI的神秘面纱”,现已成为中国人工智能市场的重要参与者,加入了商汤科技、旷视科技和百度等公司的行列。事实上,在推出后的一年内,这家初创公司已经推出了多种型号,包括 DeepSeek Coder 系列。 DeepSeek Coder的第一个版本,拥有多达330亿个参数,支持86种编程语言和16000个令牌的上下文窗口。新版本V2将支持扩展至338种语言,并将上下文窗口增加至12.8万个,让您应对更复杂的编程任务。

在旨在评估代码生成和问题解决的 MBPP+、HumanEval 和 Aider 测试中,DeepSeek Coder V2 分别得分 76.2、90.2 和 73.7 分,领先于大多数模型,包括 GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro 和 Llama-3 70B。 MATH 和 GSM8K 测试也获得了类似的结果,这些测试评估了模型的数学能力。

获得 MIT 许可 您的平台