详细内容或原文请订阅后点击阅览
中国开源人工智能的下一步是什么
《麻省理工科技评论》的“下一步是什么”系列着眼于各个行业、趋势和技术,让您对未来有一个初步的了解。您可以在此处阅读其余内容。过去的一年是中国人工智能的转折点。自2025年1月DeepSeek发布R1推理模型以来,中国企业多次交付AI……
来源:MIT Technology Review _人工智能DeepSeek 的成功为这个长期习惯于遵循而不是制定全球标准的行业注入了信心。 “三十年前,没有一个中国人会相信自己能够成为全球创新的中心,”人工智能代理公司 Atoms 的首席执行官兼创始人 Alex Chenglin Wu 说,Atoms 是中国开源生态系统的杰出贡献者。 “DeepSeek 表明,凭借扎实的技术人才、支持性环境和正确的组织文化,就有可能做出真正世界一流的工作。”
DeepSeek 的突破时刻并不是中国第一个开源成功的时刻。阿里巴巴的 Qwen Lab 多年来一直在发布开放权重模型。到 2024 年 9 月,早在 DeepSeek V3 发布之前,阿里巴巴就表示全球下载量已超过 6 亿。在 Hugging Face 上,Qwen 占 2024 年所有模型下载量的 30% 以上。其他机构,包括北京人工智能研究院和人工智能公司百川也早在 2023 年就发布了开放模型。
但自从 DeepSeek 取得成功以来,这个领域迅速扩大。 Z.ai(原智浦)、MiniMax、腾讯等公司以及越来越多的小型实验室已经发布了在推理、编码和代理式任务方面具有竞争力的模型。越来越多的有能力的模型加快了进展。曾经需要几个月才能进入开源世界的功能现在可以在几周甚至几天内出现。
“中国的人工智能公司已经从开源策略中看到了真正的收益,”清华大学计算机科学教授、人工智能初创公司 ModelBest 的首席科学家刘志远表示。 “通过发布强有力的研究,他们建立了声誉并获得了免费的宣传。”
除了商业激励之外,刘说,开源还具有文化和战略重要性。 “在中国程序员社区,开源已经变得政治正确,”他说,并将其视为对美国在专有人工智能系统领域主导地位的回应。
