详细内容或原文请订阅后点击阅览
PHI-4 - 小型模型,大结果
Microsoft的Phi-4家族是新一代的紧凑型语言模型,为数学,编码和计划等复杂任务建立,通常超过较大的系统。经过高级技术和精选数据培训,它们提供了强大的推理,同时又可以效率地用于低延迟使用。
来源:QudataPHI-4 - 小型模型,大结果
PHI-4家族是微软在小语言模型(SLMS)方面的最新进步,旨在在保持效率的同时在复杂的推理任务中表现出色。 PHI-4系列包括三个关键型号:PHI-4-ROSONING,PHI-4-REANING-PLUS和PHI-4-MINI-REANING。新发布的模型以明确的重点构建:提供高级推理性能,而无需数万亿参数模型的基础架构需求。他们使用高级技术(例如蒸馏,增强学习和精心策划的数据)在尺寸和性能之间取得了最佳的平衡。
微软在小语言模型中的最新进步PHI-4-策划是一个140亿个参数模型,具有32K令牌上下文窗口,使用高质量的Web数据和OpenAI O3 Mini提示进行了训练。它在需要详细的多步推理的任务中表现出色,例如数学,编码和算法问题解决。
phi-4-resountingphi-4-策略加上以1.5倍的额外微调和增强学习的方式进行额外的微调,从而提供了更高的准确性和推理时间性能。
phi-4-Rounowing-PlusPHI-4-MINI-RENOSITION,只有38亿个参数,接受了DeepSeek R1产生的一百万个合成数学问题的培训。它针对教育工具和移动应用程序等用例,证明能够在资源受限的环境中逐步解决问题。
phi-4-mini-resounting将PHI-4与众不同的原因不仅是效率,而且是纯粹的能力。在HumaneVal+和Math-500等基准上:
- phi-4-resounting-Plus在某些任务上胜过DeepSeek-R1(671b参数),证明更聪明的训练可以击败蛮力。它还可以匹配OpenAI的O3-Mini,并且超过了DeepSeek-R1-Distill-distill-lllama-70b在复杂的推理和规划方面的较大模型,并且在竞争中竞争,并且在竞争中竞争,甚至在竞争中竞争。基准。