Google Gemini模型现在有一个“拨号”来调整其原因
Google DeepMind对顶级双子座AI模型的最新更新包括一个拨号,以控制系统通过响应“思考”多少。这项新功能表面上是为了为开发人员节省资金,但它也承认了一个问题:推理模型,技术界的新痴迷,容易过度思考,燃烧金钱和能源……
来源:MIT Technology Review _人工智能“我们一直在推动'思维',” DeepMind的首席研究科学家杰克·雷(Jack Rae)说。这些模型是为了通过逻辑上的问题而构建的,并花费更多的时间到达答案,随着DeepSeek R1模型的推出,它在今年早些时候引起了人们的关注。它们对AI公司很有吸引力,因为它们可以通过训练以实用解决问题来更好地使现有模型更好。这样,公司可以避免从头开始构建新型号。
当AI模型将更多的时间(和能量)用于查询时,运行成本更高。推理模型的排行榜表明,一项任务的成本可能超过200美元。承诺是,这种额外的时间和金钱有助于推理模型在处理具有挑战性的任务方面做得更好,例如分析代码或从大量文档中收集信息。
能量 排行榜“您可以通过某些假设和思想迭代次数,” Google DeepMind首席技术官Koray Kavukcuoglu说,“它将找到正确的事情”。
在所有情况下都是如此。 “模型过度思考。”领导双子座产品团队的Tulsee Doshi说,专门指的是Gemini Flash 2.5,该模型今天发布了,其中包括一个滑块,供开发人员拨回其想法。 “对于简单的提示,该模型的思维确实超出了所需的方式。”
当模型在问题上花费的时间比必要的时间更长,它使该模型为开发人员运行昂贵,并使AI的环境足迹恶化。
环境足迹Nathan Habib是拥抱面孔的工程师,他研究了这种推理模型的扩散,他说,过度思考是丰富的。哈比卜说,在急于炫耀更聪明的人工智能时,即使在看不见的钉子也没有钉子的情况下,公司也正在以锤子的推理模型来达到推理模型。的确,当Openai在2月宣布了一种新模式时,它说这将是该公司的最后一个非策划模式。
宣布