详细内容或原文请订阅后点击阅览

PHI-4 - 小型模型，大结果

2025年5月15日 09:00 33 Comments

Microsoft的Phi-4家族是新一代的紧凑型语言模型，为数学，编码和计划等复杂任务建立，通常超过较大的系统。经过高级技术和精选数据培训，它们提供了强大的推理，同时又可以效率地用于低延迟使用。

来源:Qudata

PHI-4 - 小型模型，大结果

PHI-4家族是微软在小语言模型（SLMS）方面的最新进步，旨在在保持效率的同时在复杂的推理任务中表现出色。 PHI-4系列包括三个关键型号：PHI-4-ROSONING，PHI-4-REANING-PLUS和PHI-4-MINI-REANING。新发布的模型以明确的重点构建：提供高级推理性能，而无需数万亿参数模型的基础架构需求。他们使用高级技术（例如蒸馏，增强学习和精心策划的数据）在尺寸和性能之间取得了最佳的平衡。

微软在小语言模型中的最新进步

PHI-4-策划是一个140亿个参数模型，具有32K令牌上下文窗口，使用高质量的Web数据和OpenAI O3 Mini提示进行了训练。它在需要详细的多步推理的任务中表现出色，例如数学，编码和算法问题解决。

phi-4-resounting

phi-4-策略加上以1.5倍的额外微调和增强学习的方式进行额外的微调，从而提供了更高的准确性和推理时间性能。

phi-4-Rounowing-Plus

PHI-4-MINI-RENOSITION，只有38亿个参数，接受了DeepSeek R1产生的一百万个合成数学问题的培训。它针对教育工具和移动应用程序等用例，证明能够在资源受限的环境中逐步解决问题。

phi-4-mini-resounting

将PHI-4与众不同的原因不仅是效率，而且是纯粹的能力。在HumaneVal+和Math-500等基准上：

phi-4-resounting-Plus在某些任务上胜过DeepSeek-R1（671b参数），证明更聪明的训练可以击败蛮力。它还可以匹配OpenAI的O3-Mini，并且超过了DeepSeek-R1-Distill-distill-lllama-70b在复杂的推理和规划方面的较大模型，并且在竞争中竞争，并且在竞争中竞争，甚至在竞争中竞争。基准。拥抱脸 Azure AI铸造

应用程序模型的学习的增强竞争不同的证明 MINI 额外的质量的复杂的训练 REANING 最佳的发布的准确性效率 DeepSeek 模型 PHI 例如质量推理 R1 phi 性能详细的参数模型高质量的明确的数学

PHI-4 - 小型模型，大结果

PHI-4 - 小型模型，大结果

其他外部链接

Tags

XiaoMi-AI