详细内容或原文请订阅后点击阅览

微软推出完全开放权重的Phi-4型号

2025年1月13日 09:00 33 Comments

微软在 MIT 许可下推出了具有开放权重的 Phi-4 模型，为研究人员和开发人员提供了前所未有的灵活性。凭借 140 亿个参数，Phi-4 在解决数学问题和多任务处理方面的表现优于同类产品，确保以有限的资源高效工作。

来源:Qudata

微软推出权重全开放的Phi-4模型

微软在Hugging Face平台上推出了权重全开放的生成式AI模型Phi-4。自2024年12月推出以来，Phi-4因其在数学计算和多任务语言理解方面的增强性能而备受关注，同时所需的计算资源比大型模型更少。

生成式AI模型Phi-4

Phi-4拥有140亿个参数，旨在与GPT-4o mini、Gemini 2.0 Flash和Claude 3.5 Haiku等模型竞争。

这种小型语言模型（SLM）针对复杂的数学计算、逻辑推理和高效的多任务处理进行了优化。尽管尺寸较小，但Phi-4仍可提供高性能，处理长上下文，是要求精度和效率的应用程序的理想选择。另一个突出的特点是它的 MIT 许可证，允许免费使用、修改和分发，甚至用于商业目的。

微软使用合成数据和微调技术进一步增强了该模型，提高了其在需要推理的任务中的准确性。下图展示了 Phi-4 数学推理能力的一个示例。

2023 年 4 月，微软推出了 Phi-3 Mini，这是 Phi-3 系列小型语言模型中的第一款。它具有 38 亿个参数，并且在与 GPT-4 等大型模型相比较小的数据集上进行训练。随后在 8 月推出了 Phi-3.5 模型，包括 Phi-3.5-vision 和 Phi-3.5-MoE，它们利用合成数据和过滤后的公共数据集，支持多达 128,000 个 token 的上下文。小型模型开发的这种演变最终导致了 Phi-4 的发布。

最初，Phi-4 可通过 Azure AI Foundry 平台获得。现在，微软已在 MIT 许可下在 Hugging Face 平台上发布了 Phi-4，其权重为开放。Phi-4 也可通过 Ollama 获得。

Azure AI Foundry Hugging Face Ollama arXiv 上的完整技术报告

数据集许可证 3.5 推理多任务 Face 应用程序合成使用全开放的语言提高模型平台推出准确性 Hugging 高性能权重参数生成式计算资源 Phi AI 微软增强技术报告数据

微软推出完全开放权重的Phi-4型号

微软推出权重全开放的Phi-4模型

其他外部链接

Tags

XiaoMi-AI