使用 Amazon SageMaker HyperPod 训练计划加快集群采购时间
在本文中,我们将演示如何使用 Amazon SageMaker HyperPod 训练计划来缩短训练集群采购等待时间。我们将逐步指导您如何使用 (AWS CLI) 或 AWS 管理控制台查找、查看和创建适合您特定计算和时间线需求的最佳训练计划。我们将进一步指导您使用训练计划提交 SageMaker 训练作业或创建 SageMaker HyperPod 集群。
来源:亚马逊云科技 _机器学习如今,组织不断寻求使用高级大型语言模型 (LLM) 来满足其特定需求的方法。这些组织正在对大规模 LLM 进行预训练和微调,参数数量达数十亿。此过程旨在提高模型在医疗保健、金融服务和营销等不同行业中广泛应用的有效性。但是,定制这些较大的模型需要访问最新和加速的计算资源。
在本文中,我们将演示如何使用 Amazon SageMaker HyperPod 训练计划来满足此要求,这可以缩短您的训练集群采购等待时间。训练计划提供对加速计算资源的简单且可预测的访问(截至撰写本文时支持 P4d、P5、P5e、P5en 和 trn2),使您可以使用此计算能力在 Amazon SageMaker 训练作业或 SageMaker HyperPod 上运行模型训练。
Amazon SageMaker HyperPod 训练计划 加速计算资源 Amazon SageMaker 训练作业 SageMaker HyperPod我们将逐步指导您如何使用 (AWS CLI) 或 AWS 管理控制台查找、查看和创建适合您特定计算和时间线需求的最佳训练计划。我们进一步指导您使用训练计划提交 SageMaker 训练作业或创建 SageMaker HyperPod 集群。
AWS CLI AWS 管理控制台您可以在“使用新的 Amazon SageMaker HyperPod 灵活训练计划满足您的训练时间表和预算”中查看此新功能的发布。
使用新的 Amazon SageMaker HyperPod 灵活培训计划满足您的培训时间表和预算业务挑战
解决方案概述
SageMaker HyperPod 培训计划是 SageMaker 的一项新功能,它通过为您提供易于使用的控制台 UI 或 AWS CLI 体验来搜索、查看、创建和管理培训计划,从而解决这一挑战。
training-job
training-job
hyperpod-cluster