HyperPod 通过安全性和存储增强机器学习基础设施

本博文介绍了 Amazon SageMaker HyperPod 的两项主要增强功能,这些增强功能增强了大规模机器学习基础设施的安全性和存储功能。新功能包括客户管理密钥 (CMK) 支持使用组织控制的加密密钥对 EBS 卷进行加密,以及 Amazon EBS CSI 驱动程序集成,支持对 AI 工作负载中的 Kubernetes 卷进行动态存储管理。

来源:亚马逊云科技 _机器学习
Amazon SageMaker HyperPod 是一个专门构建的基础设施,用于大规模优化基础模型训练和推理。 SageMaker HyperPod 消除了构建和优化用于训练基础模型 (FM) 的机器学习 (ML) 基础设施所涉及的无差别繁重工作。随着 AI 朝着采用多种领域和用例的部署方向发展,对安全性和多种存储选项的需求变得越来越重要。大型企业希望确保 GPU 集群遵循组织范围内的策略和安全规则。 SageMaker HyperPod EKS 中的两项新功能增强了大规模机器学习工作负载生产部署的控制力和灵活性。这些功能包括对持续扩展、自定义 Amazon 系统映像和客户管理密钥 (CMK) 集成的支持。客户管理密钥 (CMK) 支持:HyperPod EKS 现在允许客户使用自己的加密密钥加密附加到 HyperPod 实例或其自定义 AMI 的主和辅助 EBS 卷。要了解有关为 HyperPod 集群创建自定义 AMI 的更多信息,请参阅我们的博客文章和文档。Amazon EBS CSI 支持:HyperPod EKS 现在支持 Amazon Elastic Block Store (Amazon EBS) 容器存储接口 (CSI) 驱动程序,该驱动程序管理 Amazon EBS 卷的生命周期,作为您创建的 Kubernetes 卷的存储。先决条件要使用这些功能,请验证您是否满足以下先决条件:客户托管密钥支持借助 CMK 支持,您可以控制合规性和安全性所需的加密功能治理,最终帮助解决未满足监管和组织安全要求(例如 HIPAA 和 FIPS 合规性)的关键业务风险。 CMK 支持允许客户使用自己的加密密钥加密附加到其 HyperPod 实例的 EBS 卷。创建集群、更新集群或添加新实例组时,客户可以指定 C