详细内容或原文请订阅后点击阅览
DeepSeek 尘埃落定后,你需要知道的三件事
这个故事最初出现在我们的 AI 每周通讯《算法》中。要首先在您的收件箱中收到这样的故事,请在此处注册。单个新 AI 模型的推出通常不会在科技圈外引起太大轰动,也不会吓坏投资者,导致 1 万亿美元损失……
来源:MIT Technology Review _人工智能但是,在人工智能领域,DeepSeek 可能在长期内产生什么影响?以下是 DeepSeek 播下的三颗种子,即使最初的炒作消退,它们也会生根发芽。
首先,它引发了一场关于人工智能模型应该被允许使用多少能量来寻求更好的答案的争论。
首先,它引发了一场关于人工智能模型应该被允许使用多少能量来寻求更好的答案的争论。您可能已经听说过(包括我从我这里听说的),DeepSeek 是节能的。这对于它的训练阶段来说确实如此,但对于推理,即当您实际向模型询问某个问题并得到答案时,它就很复杂了。它使用一种思维链技术,将复杂的问题(例如,为了保护某人的感情而撒谎是否合适)分解成块,然后合乎逻辑地回答每个问题。这种方法使像 DeepSeek 这样的模型在数学、逻辑、编码等方面表现得更好。
我至少对某些人来说,问题在于这种“思考”方式比我们习惯的人工智能消耗更多的电力。尽管目前人工智能只占全球总排放量的一小部分,但越来越多的政治支持大幅增加用于人工智能的能源量。当然,思维链模型的能量强度是否值得,取决于我们使用人工智能的目的。治疗世界上最严重疾病的科学研究似乎是值得的。产生人工智能垃圾?就没那么值得了。
增加一些专家担心,DeepSeek 的令人印象深刻将导致公司将其纳入许多应用程序和设备,并且用户会在不需要它的场景中使用它。 (例如,让 DeepSeek 解释爱因斯坦的相对论是一种浪费,因为它不需要逻辑推理步骤,任何典型的 AI 聊天模型都可以用更少的时间和精力做到这一点。)在这里阅读更多我的信息。
在这里阅读更多我的信息其次,DeepSeek 在训练方式上取得了一些创造性的进步,其他公司可能会效仿。