详细内容或原文请订阅后点击阅览
引入Gemma 3 270m:高效AI
今天,我们正在为Gemma 3工具包添加了一个新的,高度专业的工具:Gemma 3 270m,一个紧凑型,2.7亿参数模型。
来源:DeepMind - 新闻与博客最近几个月对于杰玛(Gemma)的开放模型家族来说,这是一个激动人心的时刻。我们介绍了Gemma 3和Gemma 3 Qat,为单云和桌面加速器提供了最先进的性能。然后,我们宣布了Gemma 3N的完整发行版,Gemma 3N是一种移动优先的架构,将功能强大的实时多模式AI直接带到边缘设备。我们的目标是为开发人员提供有用的工具,以便与AI一起构建,并且我们继续为您所帮助创建的充满活力的Gemmaverse感到惊讶,随着上周下载超过2亿美元的庆祝,我们一起庆祝。
Gemma 3 gemma 3 qat Gemma 3n 惊讶 gemmaverse今天,我们正在为Gemma 3工具包添加了一个新的,高度专业的工具:Gemma 3 270m,一种紧凑的,2.7亿亿的参数模型,从头开始设计,用于特定于任务的微型调整,并具有强大的指令遵循和文本结构功能。
Gemma 3 270mGemma 3 270m将强大的指导跟踪功能带到小英寸的模型。如IFEVAL基准测试(测试模型遵循可验证说明的能力)所示,它为其尺寸建立了新的性能水平,从而使复杂的AI功能更容易在设备和研究应用程序中访问。
Gemma的核心功能3 270m
- 紧凑且有能力的体系结构:我们的新型号总共有2.7亿个参数:1.7亿个嵌入参数,原因很大,词汇量很大,而我们的变压器块的嵌入了1亿个参数。得益于256K代币的大型词汇,该模型可以处理特定且稀有的令牌,使其成为强大的基础模型,可以在特定的域和语言中进行进一步调整。
- 极端能源效率:Gemma 3 270m的关键优势是其低功耗。 Pixel 9 Pro Soc上的内部测试显示,INT4定量模型仅使用了25次对话的电池的0.75%,这使其成为我们最有效的Gemma模型。