NVIDIA Nemotron 3 Nano 30B MoE 模型现已在 Amazon SageMaker JumpStart 中提供

今天,我们很高兴地宣布,具有 3B 活动参数的 NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpStart 模型目录中全面上市。您可以利用 Amazon Web Services (AWS) 上的 Nemotron 3 Nano 加速创新并提供切实的业务价值,而无需管理模型部署的复杂性。您可以使用 SageMaker JumpStart 提供的托管部署功能,通过 Nemotron 功能为您的生成式 AI 应用程序提供支持。

来源:亚马逊云科技 _机器学习

今天,我们很高兴地宣布,具有 3B 活动参数的 NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpStart 模型目录中全面上市。您可以利用 Amazon Web Services (AWS) 上的 Nemotron 3 Nano 加速创新并提供切实的业务价值,而无需管理模型部署的复杂性。您可以使用 SageMaker JumpStart 提供的托管部署功能,通过 Nemotron 功能为您的生成式 AI 应用程序提供支持。

Nemotron 3 Nano 是一种小语言混合专家 (MoE) 模型,具有最高的计算效率和准确性,可供开发人员大规模驱动高技能的代理任务。该模型完全开放,具有开放权重、数据集和配方,因此开发人员可以在其基础设施上无缝定制、优化和部署模型,以帮助满足他们的隐私和安全要求。 Nemotron 3 Nano 在编码和推理方面表现出色,在 SWE Bench Verified、GPQA Diamond、AIME 2025、Arena Hard v2 和 IFBench 等基准测试中处于领先地位。

关于 Nemotron 3 Nano 30B

Nemotron 3 Nano 以其架构和精度区别于其他型号,在各种高技术技能方面拥有强大的性能:

  • 架构:
  • ο      具有混合 Transformer-Mamba 架构的 MoE ο      支持令牌预算,以最少的推理令牌生成提供最佳精度
  • 准确度:
  • 在编码、科学推理、数学和指令遵循方面具有领先的准确性
  • 在 LiveCodeBench、GPQA Diamond、AIME 2025、BFCL 和 IFBench 等基准测试中处于领先地位(与 30B 以下的其他开放语言模型相比)
  • 可用性:
  • 30B参数模型,拥有30亿个活跃参数
  • 具有最多 100 万个令牌的上下文窗口
  • 基于文本的基础模型,使用文本作为输入和输出
  • 先决条件

    要开始在 Amazon SageMaker JumpStart 中使用 Nemotron 3 Nano,您必须拥有预置的 Amazon SageMaker Studio 域。

    在 SageMaker JumpStart 中开始使用 NVIDIA Nemotron 3 Nano 30B