微软推出完全开放权重的Phi-4型号

微软在 MIT 许可下推出了具有开放权重的 Phi-4 模型,为研究人员和开发人员提供了前所未有的灵活性。凭借 140 亿个参数,Phi-4 在解决数学问题和多任务处理方面的表现优于同类产品,确保以有限的资源高效工作。

来源:Qudata

微软推出权重全开放的Phi-4模型

微软在Hugging Face平台上推出了权重全开放的生成式AI模型Phi-4。自2024年12月推出以来,Phi-4因其在数学计算和多任务语言理解方面的增强性能而备受关注,同时所需的计算资源比大型模型更少。

生成式AI模型Phi-4

Phi-4拥有140亿个参数,旨在与GPT-4o mini、Gemini 2.0 Flash和Claude 3.5 Haiku等模型竞争。

这种小型语言模型(SLM)针对复杂的数学计算、逻辑推理和高效的多任务处理进行了优化。尽管尺寸较小,但Phi-4仍可提供高性能,处理长上下文,是要求精度和效率的应用程序的理想选择。另一个突出的特点是它的 MIT 许可证,允许免费使用、修改和分发,甚至用于商业目的。

微软使用合成数据和微调技术进一步增强了该模型,提高了其在需要推理的任务中的准确性。下图展示了 Phi-4 数学推理能力的一个示例。

2023 年 4 月,微软推出了 Phi-3 Mini,这是 Phi-3 系列小型语言模型中的第一款。它具有 38 亿个参数,并且在与 GPT-4 等大型模型相比较小的数据集上进行训练。随后在 8 月推出了 Phi-3.5 模型,包括 Phi-3.5-vision 和 Phi-3.5-MoE,它们利用合成数据和过滤后的公共数据集,支持多达 128,000 个 token 的上下文。小型模型开发的这种演变最终导致了 Phi-4 的发布。

最初,Phi-4 可通过 Azure AI Foundry 平台获得。现在,微软已在 MIT 许可下在 Hugging Face 平台上发布了 Phi-4,其权重为开放。Phi-4 也可通过 Ollama 获得。

Azure AI Foundry Hugging Face Ollama arXiv 上的完整技术报告