宣布Amazon Sagemaker HyperPod的新群集创建体验

借助新的群集创建体验,您可以单击一键创建SageMaker HyperPod群集,包括所需的先决条件AWS资源,并自动使用规定默认值。在这篇文章中,我们探索了亚马逊萨吉式制造商Hyperpod的新集群创建体验。

来源:亚马逊云科技 _机器学习
Today, Amazon SageMaker HyperPod is announcing a new one-click, validated cluster creation experience that accelerates setup and prevents common misconfigurations, so you can launch your distributed training and inference clusters complete with Slurm or Amazon Elastic Kubernetes Service (Amazon EKS) orchestration, Amazon Virtual Private Cloud (Amazon VPC) networking, high-performance storage, and security built in by默认值。与SageMaker HyperPod一起,您可以有效地扩展任务,例如生成AI训练,微调或对具有数百或数千个AI加速器的群集的推理。该系统会不断检查硬件问题,自动解决问题,并确保您的工作负载无需手动干预即可恢复。请注意,要求客户建立VPC,Amazon Simple Storage Service(Amazon S3)桶,AWS Identity and Access Management(IAM)角色,其他AWS资源,以及其他AWS资源,并将其作为创建Sagempodaker的前提。这个多步骤的过程创建了可能发生错误配置的手动触摸点。在新的群集创建体验中,您可以在一键单击中创建SageMaker HyperPod簇,包括所需的先决条件AWS资源,并自动应用规定默认值。在这篇文章中,我们探索了亚马逊萨吉式制造商Hyperpod的新群集创建体验。SustolutionofviewSagemaker HyperPod在AWS管理控制台上提供了两个新的部署选项,用于创建由Slurm和Amazon EKS精心策划的群集:快速设置和自定义设置。这两个选项均在亚马逊sagemaker AI控制台上呈现。当您创建一个群集时,SageMaker Hyperpod创建了AWS云形式堆栈,以部署群集并使用指定的配置来支撑资源,并在AWS Cloud Formation中使用您的云架构