大规模管理 ML 生命周期,第 2 部分:多账户基础

您的多账户策略是 AWS 上基础环境的核心。围绕多账户环境的设计决策对于大规模安全运营至关重要。将您的工作负载战略性地分组到多个 AWS 账户中,使您能够跨工作负载应用不同的控制、跟踪成本和使用情况、减少账户限制的影响并降低复杂性 […]

来源:亚马逊云科技 _机器学习

多账户策略是 AWS 基础环境的核心。围绕多账户环境的设计决策对于大规模安全运营至关重要。将工作负载战略性地分组到多个 AWS 账户中,可以让您跨工作负载应用不同的控制、跟踪成本和使用情况、减少账户限制的影响,并通过允许不同的团队访问针对其目的量身定制的不同账户来减轻管理多个虚拟私有云 (VPC) 和身份的复杂性。

在本系列的第 1 部分“大规模管理 ML 生命周期,第 1 部分:使用 Amazon SageMaker 构建 ML 工作负载的框架”中,您了解了在 AWS 上大规模操作和管理机器学习 (ML) 和分析工作负载的最佳实践。在这篇文章中,我们提供了实施多账户基础架构的指导,该架构可帮助您组织、构建和管理以下模块:数据湖基础、ML 平台服务、ML 用例开发、ML 操作、集中式功能存储、日志记录和可观察性以及成本和报告。

大规模管理 ML 生命周期,第 1 部分:使用 Amazon SageMaker 构建 ML 工作负载的框架

我们涵盖了大规模管理 ML 生命周期的多账户策略的以下关键领域:

  • 实施推荐的账户和组织单位结构,以隔离 AWS 资源(计算、网络、数据)并为 ML 和分析团队提供成本可见性
  • 使用 AWS Control Tower 实施基线着陆区,以支持扩展和管理数据和 ML 工作负载
  • AWS Control Tower
  • 使用 AWS 安全参考架构在多账户环境中大规模保护数据和 ML 工作负载
  • 使用 AWS Service Catalog 在多账户环境中扩展、共享和重用 ML,并实施网络基线配置
  • AWS Service Catalog AWS Identity and Access Management