中国的开源赌注

硅谷人工智能公司遵循熟悉的剧本:保留 API 背后的秘密,并对每一滴收费。中国领先的人工智能实验室正在玩不同的游戏:他们将模型作为可下载的“开放重量”包提供。这使得开发人员可以调整模型并在自己的硬件上运行它们来构建产品,而无需协商......

来源:MIT Technology Review _人工智能

中国大力推动这一势头。 DeepSeek 发布一年后,现在有一批中国开源巨头遵循同样的蓝图,包括 Z.ai(以前的智普)、Moonshot、阿里巴巴的 Qwen 和 MiniMax。他们都在竞相推出功能更强大的车型,并且正在以难以预料的速度逼近美国竞争对手。

这很重要,因为人工智能炒作正在逐渐减弱,公司正在将焦点从热闹的试点转向部署和集成,而更便宜和更可定制的工具往往会获胜。中国的定价意味着预算有限的开发商可以进行更多尝试,而开放权重意味着他们可以在无需征求许可的情况下调整模型。

麻省理工学院和 Hugging Face 的研究人员进行的一项研究发现,截至 2025 年 8 月的一年中,中国的开放权重模型下载量占全球 AI 模型下载量的 17.1%。这略超美国 15.86% 的份额,这是中国首次在这一指标上处于领先地位。 Hugging Face 上个月的数据显示,阿里巴巴的模型(包括 Qwen 系列)现在拥有最多的用户生成变体,比 Google 和 Meta 的模型总和还要多。

然而,开源理想却陷入了一些残酷的现实。中国的模型带有中国内容审核制度的印记,并经过培训以避免与政府政策相冲突的输出。今年 2 月,Anthropic 指控几家中国实验室通过蒸馏非法提取克劳德的能力,蒸馏是一种使用一个模型的输出来训练另一个模型的过程。这是标准的行业惯例,但 OpenAI 和 Anthropic 等美国顶级公司声称中国公司使用了欺诈手段来做到这一点。