DeepSeek报告了R1在新论文中的令人震惊的低培训成本

这一重新点燃了一月的AI投资者恐慌吗?

来源:ZDNet | 机器人新闻
NURPHOTO/贡献者/努力通过Getty Images

关注ZDNET:将我们添加为Google上的首选来源。

关注ZDNET: 将我们添加为首选源 在Google上。

ZDNET的钥匙外卖

    DeepSeek下降了其R1模型的构建成本。 R1的功能使投资者质疑高昂的AI支出。NVIDIA拒绝透露是否计划使用英特尔的工厂。
  • DeepSeek下降了其R1模型的构建成本。
  • R1的功能使投资者质疑高昂的AI支出。
  • nvidia拒绝说是否计划使用英特尔的工厂。
  • DeepSeek是中国人工智能实验室,它在一月份以令人印象深刻的开源R1模型震撼了市场,终于揭示了这么多人想知道的秘密:它比其他主要是美国前沿模型的公司更便宜地训练R1。

    DeepSeek 以其令人印象深刻的开源R1型

    也:担心AI的能源需求?避免聊天机器人无济于事 - 但是3件事可能

    担心AI的能量需求?避免聊天机器人无济于事 - 但是3件事可能

    该公司在周三发表的一篇论文中写道,R1建筑物仅花费249,000美元,这在AI的高消费世界中的数量非常低。 DeepSeek在较早的研究论文中说,其V3模型与Claude这样的标准聊天机器人模型家族类似,培训成本为560万美元。

    研究论文 Claude

    这个数字已有争议,一些专家质疑它是否包括所有开发成本(包括基础架构,研发,数据等),还是单身进行最终培训。无论如何,这仍然是像OpenAI这样的公司所花费的型号的一小部分(Sam Altman本人估计,GPT-4的成本为1亿美元以北)。

    一些专家询问 分数 估计

    这种差异也反映在DeepSeek向用户收取R1的费用:0.14美元的一百万个令牌(分析了750,000个单词) - 相比之下,同等级别的OpenAI费用为7.50美元。

    gpus