phi-4反应如何通过挑战“更大是更好”的神话来重新定义AI推理

Microsoft最近发布的PHI-4-RONOAGING挑战是建立能够推理的人工智能系统的关键假设。自2022年引入了经过思考的推理以来,研究人员认为,高级推理需要具有数千亿个参数的非常大的语言模型。但是,微软的新的140亿个参数模型,PHI-4 - 策划了这种信念。使用以数据为中心的方法[…]帖子如何通过挑战“更大”的神话来重新定义AI推理,这是在Unite.ai上首先出现的。

来源:Unite.AI

Microsoft最近发布的PHI-4-RONOAGING挑战是建立能够推理的人工智能系统的关键假设。自2022年引入了经过思考的推理以来,研究人员认为,高级推理需要具有数千亿个参数的非常大的语言模型。但是,微软的新的140亿个参数模型,PHI-4 - 策划了这种信念。该模型使用以数据为中心的方法而不是依赖纯粹的计算能力,可以实现与大型系统相当的性能。这一突破表明,以数据为中心的方法对于培训推理模型也可以像常规AI培训一样有效。它为较小的AI模型提供了通过改变AI开发人员训练推理模型的方式来实现高级推理的可能性,从“更大的是更好”转变为“更好的数据”更好。

phi-4-resounting

传统推理范式

经过思考的推理已成为解决人工智能中复杂问题的标准。该技术通过逐步推理指导语言模型,将困难问题分解为较小,易于管理的步骤。它通过在给出答案之前先用自然语言“大声思考”来模仿人类的思维。

经过思考的推理

但是,这种能力具有重要的限制。研究人员一贯发现,只有在语言模型非常大的情况下,经过思考的促进链条才能很好地工作。推理能力似乎直接与模型大小联系在一起,更大的模型在复杂的推理任务上的性能更好。这一发现导致了建立大型推理模型的竞争,在该模型中,公司致力于将其大型语言模型转变为强大的推理引擎。

找到 内在学习 观察到 增强学习

了解以数据为中心的方法

以数据为中心的AI 促进 更重要 课程学习 教科书是您需要的 phi-3

Phi-4-Rounowing的突破性策略

deepseek-r1