DeepSeek报告了R1在新论文中的令人震惊的低培训成本 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

DeepSeek报告了R1在新论文中的令人震惊的低培训成本

2025年9月22日 12:24 33 Comments

这一重新点燃了一月的AI投资者恐慌吗？

来源:ZDNet | 机器人新闻

NURPHOTO/贡献者/努力通过Getty Images

关注ZDNET：将我们添加为Google上的首选来源。

关注ZDNET： 将我们添加为首选源 在Google上。

DeepSeek下降了其R1模型的构建成本。 R1的功能使投资者质疑高昂的AI支出。NVIDIA拒绝透露是否计划使用英特尔的工厂。

DeepSeek下降了其R1模型的构建成本。

R1的功能使投资者质疑高昂的AI支出。

nvidia拒绝说是否计划使用英特尔的工厂。

DeepSeek是中国人工智能实验室，它在一月份以令人印象深刻的开源R1模型震撼了市场，终于揭示了这么多人想知道的秘密：它比其他主要是美国前沿模型的公司更便宜地训练R1。

DeepSeek 以其令人印象深刻的开源R1型

也：担心AI的能源需求？避免聊天机器人无济于事 - 但是3件事可能

担心AI的能量需求？避免聊天机器人无济于事 - 但是3件事可能

该公司在周三发表的一篇论文中写道，R1建筑物仅花费249,000美元，这在AI的高消费世界中的数量非常低。 DeepSeek在较早的研究论文中说，其V3模型与Claude这样的标准聊天机器人模型家族类似，培训成本为560万美元。

纸研究论文 Claude

这个数字已有争议，一些专家质疑它是否包括所有开发成本（包括基础架构，研发，数据等），还是单身进行最终培训。无论如何，这仍然是像OpenAI这样的公司所花费的型号的一小部分（Sam Altman本人估计，GPT-4的成本为1亿美元以北）。

一些专家询问分数估计

这种差异也反映在DeepSeek向用户收取R1的费用：0.14美元的一百万个令牌（分析了750,000个单词） - 相比之下，同等级别的OpenAI费用为7.50美元。

gpus

000 机器人询问论文美国花费的质疑 R1 人工智能 DeepSeek 知道的是否模型 Google Claude 首选公司模型的 ZDNET 仍然是专家开发成本 AI 计划聊天实验室能量需求建筑物