在 Amazon Bedrock 上运行 NVIDIA Nemotron 3 Super XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

在 Amazon Bedrock 上运行 NVIDIA Nemotron 3 Super

2026年3月19日 17:25 33 Comments

本文探讨了 Nemotron 3 Super 模型的技术特征并讨论了潜在的应用用例。它还提供了技术指导，帮助您开始在 Amazon Bedrock 环境中将此模型用于生成 AI 应用程序。

来源:亚马逊云科技 _机器学习

Nemotron 3 Super 现已在 Amazon Bedrock 上作为完全托管的无服务器模型提供，加入了 Amazon Bedrock 环境中已提供的 Nemotron Nano 模型。

借助 Amazon Bedrock 上的 NVIDIA Nemotron 开放模型，您可以加速创新并提供切实的业务价值，而无需管理基础设施的复杂性。您可以通过 Amazon Bedrock 的全面托管推理，利用其丰富的功能和工具，通过 Nemotron 为您的生成式 AI 应用程序提供支持。

Nemotron 3 Super 是一种混合专家 (MoE) 模型，具有领先的计算效率和准确性，适用于多代理应用程序和专门的代理 AI 系统。该模型以开放权重、数据集和配方的形式发布，因此开发人员可以在其基础设施上自定义、改进和部署模型，以增强隐私和安全性。

模型概述：

架构：

采用 Hybrid Transformer-Mamba 架构的 MoE。

支持令牌预算，以最少的推理令牌生成提供更高的准确性。

准确度：

其尺寸类别中吞吐量效率最高，比之前的 Nemotron Super 型号高出 5 倍。

推理和代理任务的准确性在领先的开放模型中处于领先地位，并且比之前版本的准确性提高了 2 倍。

在领先基准测试中实现高精度，包括 AIME 2025、Terminal-Bench、SWE Bench 验证和多语言、RULER。

多环境 RL 训练使模型在 NVIDIA NeMo 的 10 多个环境中具有领先的准确性。

模型大小：120 B，具有 12 B 活动参数

上下文长度：最多 256K 个标记

模型输入：文本

模型输出：文本

语言：英语、法语、德语、意大利语、日语、西班牙语和中文

服务器 MoE 计算效率 Bedrock 吞吐量 Super 提供提高模型文本输入最少的基础设施 Nemotron 环境意大利领先的准确度讨论技术指导数据集推理丰富的开放西班牙开发人员高精度应用程序专门的代理潜在的模型的准确性复杂性托管 AI 安全性 Amazon