PHI-4 - 小型模型,大结果

Microsoft的Phi-4家族是新一代的紧凑型语言模型,为数学,编码和计划等复杂任务建立,通常超过较大的系统。经过高级技术和精选数据培训,它们提供了强大的推理,同时又可以效率地用于低延迟使用。

来源:Qudata

PHI-4 - 小型模型,大结果

PHI-4家族是微软在小语言模型(SLMS)方面的最新进步,旨在在保持效率的同时在复杂的推理任务中表现出色。 PHI-4系列包括三个关键型号:PHI-4-ROSONING,PHI-4-REANING-PLUS和PHI-4-MINI-REANING。新发布的模型以明确的重点构建:提供高级推理性能,而无需数万亿参数模型的基础架构需求。他们使用高级技术(例如蒸馏,增强学习和精心策划的数据)在尺寸和性能之间取得了最佳的平衡。

微软在小语言模型中的最新进步

PHI-4-策划是一个140亿个参数模型,具有32K令牌上下文窗口,使用高质量的Web数据和OpenAI O3 Mini提示进行了训练。它在需要详细的多步推理的任务中表现出色,例如数学,编码和算法问题解决。

phi-4-resounting

phi-4-策略加上以1.5倍的额外微调和增强学习的方式进行额外的微调,从而提供了更高的准确性和推理时间性能。

phi-4-Rounowing-Plus

PHI-4-MINI-RENOSITION,只有38亿个参数,接受了DeepSeek R1产生的一百万个合成数学问题的培训。它针对教育工具和移动应用程序等用例,证明能够在资源受限的环境中逐步解决问题。

phi-4-mini-resounting

将PHI-4与众不同的原因不仅是效率,而且是纯粹的能力。在HumaneVal+和Math-500等基准上:

    phi-4-resounting-Plus在某些任务上胜过DeepSeek-R1(671b参数),证明更聪明的训练可以击败蛮力。它还可以匹配OpenAI的O3-Mini,并且超过了DeepSeek-R1-Distill-distill-lllama-70b在复杂的推理和规划方面的较大模型,并且在竞争中竞争,并且在竞争中竞争,甚至在竞争中竞争。基准。
拥抱脸 Azure AI铸造