在 Amazon Bedrock 上运行 NVIDIA Nemotron 3 Super

本文探讨了 Nemotron 3 Super 模型的技术特征并讨论了潜在的应用用例。它还提供了技术指导,帮助您开始在 Amazon Bedrock 环境中将此模型用于生成 AI 应用程序。

来源:亚马逊云科技 _机器学习

Nemotron 3 Super 现已在 Amazon Bedrock 上作为完全托管的无服务器模型提供,加入了 Amazon Bedrock 环境中已提供的 Nemotron Nano 模型。

借助 Amazon Bedrock 上的 NVIDIA Nemotron 开放模型,您可以加速创新并提供切实的业务价值,而无需管理基础设施的复杂性。您可以通过 Amazon Bedrock 的全面托管推理,利用其丰富的功能和工具,通过 Nemotron 为您的生成式 AI 应用程序提供支持。

本文探讨了 Nemotron 3 Super 模型的技术特征并讨论了潜在的应用用例。它还提供了技术指导,帮助您开始在 Amazon Bedrock 环境中将此模型用于生成 AI 应用程序。

关于 Nemotron 3 Super

Nemotron 3 Super 是一种混合专家 (MoE) 模型,具有领先的计算效率和准确性,适用于多代理应用程序和专门的代理 AI 系统。该模型以开放权重、数据集和配方的形式发布,因此开发人员可以在其基础设施上自定义、改进和部署模型,以增强隐私和安全性。

模型概述:

  • 架构:
  • 采用 Hybrid Transformer-Mamba 架构的 MoE。
  • 支持令牌预算,以最少的推理令牌生成提供更高的准确性。
  • 准确度:
  • 其尺寸类别中吞吐量效率最高,比之前的 Nemotron Super 型号高出 5 倍。
  • 推理和代理任务的准确性在领先的开放模型中处于领先地位,并且比之前版本的准确性提高了 2 倍。
  • 在领先基准测试中实现高精度,包括 AIME 2025、Terminal-Bench、SWE Bench 验证和多语言、RULER。
  • 多环境 RL 训练使模型在 NVIDIA NeMo 的 10 多个环境中具有领先的准确性。
  • 模型大小:120 B,具有 12 B 活动参数
  • 上下文长度:最多 256K 个标记
  • 模型输入:文本
  • 模型输出:文本
  • 语言:英语、法语、德语、意大利语、日语、西班牙语和中文
  • 潜在 MoE