A3B关键词检索结果

使用 G7e 实例加速 Amazon SageMaker AI 上的生成式 AI 推理

Accelerate Generative AI Inference on Amazon SageMaker AI with G7e Instances

今天,我们很高兴地宣布在 Amazon SageMaker AI 上推出由 NVIDIA RTX PRO 6000 Blackwell 服务器版 GPU 提供支持的 G7e 实例。您可以为节点配置 1、2、4 和 8 个 RTX PRO 6000 GPU 实例,每个 GPU 提供 96 GB GDDR7 内存。此次发布提供了使用单节点 GPU、G7e.2xlarge 实例来托管强大的开源基础模型 (FM)(例如 GPT-OSS-120B、Nemotron-3-Super-120B-A12B(NVFP4 变体)和 Qwen3.5-35B-A3B)的功能,为组织提供了经济高效且高性能的选择。