详细内容或原文请订阅后点击阅览
Amazon 如何使用 Amazon SageMaker Pipelines 大规模训练顺序集成模型
集成模型在 ML 社区中越来越受欢迎。它们通过组合多个模型的预测来生成更准确的预测。管道可以快速用于为集成模型创建端到端 ML 管道。这使开发人员能够构建高度准确的模型,同时保持效率和可重复性。在这篇文章中,我们提供了一个使用管道训练和部署的集成模型的示例。
来源:亚马逊云科技 _机器学习Amazon SageMaker Pipelines 包含可让您简化和自动化机器学习 (ML) 工作流的功能。这使科学家和模型开发人员可以专注于模型开发和快速实验,而不是基础设施管理
Amazon SageMaker PipelinesPipelines 提供了使用简单的 Python SDK 编排复杂 ML 工作流的能力,并能够通过 SageMaker Studio 可视化这些工作流。这有助于数据准备和特征工程任务以及模型训练和部署自动化。Pipelines 还与 Amazon SageMaker Automatic Model Tuning 集成,后者可以根据您选择的指标自动找到导致最佳性能模型的超参数值。
集成模型在 ML 社区中越来越受欢迎。它们通过组合多个模型的预测来生成更准确的预测。管道可以快速用于为集成模型创建端到端 ML 管道。这使开发人员能够构建高度准确的模型,同时保持效率和可重复性。
在本文中,我们提供了一个使用 Pipelines 进行训练和部署的集成模型示例。
用例概述
销售代表生成新的潜在客户并在 Salesforce 中创建机会来跟踪他们。以下应用程序是一种使用无监督学习的 ML 方法,可根据各种文本信息(例如名称、描述、详细信息和产品服务组)自动识别每个机会中的用例。
初步分析表明,用例因行业而异,不同用例的年收入分布非常不同,可以帮助细分。因此,用例是一个重要的预测特征,可以优化分析并改进销售推荐模型。
该方法使用三个连续的 BERTopic 模型以分层方法生成最终聚类。
每个 BERTopic 模型由四个部分组成: