使用全新改进的 Amazon SageMaker Python SDK 加速您的 ML 生命周期 - 第 1 部分:ModelTrainer

在本文中,我们重点介绍 ModelTrainer 类,以简化训练体验。ModelTrainer 类比当前的 Estimator 类有显著改进,本文将对此进行详细讨论。我们将向您展示如何使用 ModelTrainer 类来训练您的 ML 模型,其中包括使用自定义脚本或容器执行分布式训练。在第 2 部分中,我们将向您展示如何使用改进的 ModelBuilder 类构建模型并部署到 SageMaker 终端节点。

来源:亚马逊云科技 _机器学习

Amazon SageMaker 已重新设计其 Python SDK,以提供统一的面向对象接口,使与 SageMaker 服务的交互变得简单直接。新 SDK 的设计考虑了分层用户体验,其中新的低级 SDK(SageMaker Core)提供对 SageMaker 全部功能和配置的访问,为 ML 工程师提供更大的灵活性和控制力。更高级别的抽象层专为 AWS 专业知识有限的数据科学家设计,提供隐藏复杂基础设施细节的简化界面。

Amazon SageMaker SageMaker Core

在这个由两部分组成的系列中,我们介绍了 SageMaker Python SDK 的抽象层,它允许您使用新的 ModelTrainer 和改进的 ModelBuilder 类来训练和部署机器学习 (ML) 模型。

在本文中,我们重点介绍 ModelTrainer 类,以简化训练体验。 ModelTrainer 类比当前的 Estimator 类有了显著的改进,本文将对此进行详细讨论。我们将向您展示如何使用 ModelTrainer 类来训练您的 ML 模型,其中包括使用自定义脚本或容器执行分布式训练。在第 2 部分中,我们将向您展示如何使用改进的 ModelBuilder 类构建模型并部署到 SageMaker 端点。

Estimator 第 2 部分

ModelTrainer 类的优势

新的 ModelTrainer 类旨在解决与 Estimator 类相关的可用性挑战。展望未来,ModelTrainer 将成为模型训练的首选方法,带来显著的增强功能,大大改善用户体验。这一演变标志着朝着实现一流模型训练开发人员体验迈出了一步。以下是主要优势:

提高直观性 简化脚本模式和 BYOC 简化分布式训练 命令 SourceCode 改进超参数契约 SM_HPS ModelTrainer

使用 ModelTrainer 类启动训练作业

SourceCode SDK 默认值