详细内容或原文请订阅后点击阅览
DeepSeek报告了R1在新论文中的令人震惊的低培训成本
这一重新点燃了一月的AI投资者恐慌吗?
来源:ZDNet | 机器人新闻关注ZDNET:将我们添加为Google上的首选来源。
关注ZDNET: 将我们添加为首选源 在Google上。ZDNET的钥匙外卖
- DeepSeek下降了其R1模型的构建成本。 R1的功能使投资者质疑高昂的AI支出。NVIDIA拒绝透露是否计划使用英特尔的工厂。
DeepSeek是中国人工智能实验室,它在一月份以令人印象深刻的开源R1模型震撼了市场,终于揭示了这么多人想知道的秘密:它比其他主要是美国前沿模型的公司更便宜地训练R1。
DeepSeek 以其令人印象深刻的开源R1型也:担心AI的能源需求?避免聊天机器人无济于事 - 但是3件事可能
担心AI的能量需求?避免聊天机器人无济于事 - 但是3件事可能该公司在周三发表的一篇论文中写道,R1建筑物仅花费249,000美元,这在AI的高消费世界中的数量非常低。 DeepSeek在较早的研究论文中说,其V3模型与Claude这样的标准聊天机器人模型家族类似,培训成本为560万美元。
纸 研究论文 Claude这个数字已有争议,一些专家质疑它是否包括所有开发成本(包括基础架构,研发,数据等),还是单身进行最终培训。无论如何,这仍然是像OpenAI这样的公司所花费的型号的一小部分(Sam Altman本人估计,GPT-4的成本为1亿美元以北)。
一些专家询问 分数 估计这种差异也反映在DeepSeek向用户收取R1的费用:0.14美元的一百万个令牌(分析了750,000个单词) - 相比之下,同等级别的OpenAI费用为7.50美元。
gpus