在本文中,您将了解如何使用适用于 ML 的 Amazon Elastic Compute Cloud (Amazon EC2) 容量块和 Amazon SageMaker 训练计划来确保短期工作负载的预留 GPU 容量。当您需要短期容量进行负载测试、模型验证、有时限的研讨会或在发布前准备推理能力时,这些解决方案可以解决 GPU 可用性挑战。
NVIDIA Nemotron 3 Ultra now available on Amazon SageMaker JumpStart
在 Amazon SageMaker JumpStart 上部署 NVIDIA Nemotron 3 Ultra。借助此前沿推理模型,代理 AI 工作负载的推理速度提高 5 倍,成本降低 30%。
Get a Good Return on Your AI Investments
上周,我们举办了 2026 年首个基础设施和运营超级直播:人工智能时代的平台工程。我们的演讲者探讨了一系列专注于支持新的人工智能工作负载的主题,每个主题都有独特的基础设施需求、不可预测的成本和新的安全问题。 Google Cloud 的 Abdel Sghiouar 带领观众了解了一个多么好的平台 [...]