构建和部署AI推理工作流,并为Amazon Sagemaker Python SDK

在这篇文章中,我们提供了用户体验的概述,详细介绍了如何使用SageMaker Python SDK使用多个模型来设置和部署这些工作流程。我们介绍构建复杂推理工作流程,将它们部署到sagemaker端点的示例,并调用它们进行实时推理。

来源:亚马逊云科技 _机器学习
Amazon SageMaker推论一直是部署高级机器学习(ML)和生成AI模型的流行工具。随着AI应用程序变得越来越复杂,客户希望在协调组中部署多个模型,以共同处理应用程序的推理请求。此外,随着生成AI应用程序的演变,许多用例现在需要推理工作流程 - 以预定义逻辑流中运行的互连模型的序列。这种趋势推动了对更复杂的推理产品的日益增长的需求。为了满足这一需求,我们正在萨吉马制造商Python SDK中引入了新的能力,该功能彻底改变了您在SageMaker上的构建和部署推理工作流程的革新。我们将以亚马逊搜索为例,以展示情况,以表明该功能如何用于帮助客户构建推理工作流程。这种新的Python SDK功能提供了一种简化而简化的体验,该体验抽象了包装和部署模型组及其集体推理逻辑的基本复杂性,使您可以专注于最重要的事情 - 您的业务逻辑和模型集成。在这篇文章中,我们提供了用户体验的概述,并详细介绍了这些模型,并详细介绍了这些模型,并使用了多个模型,并将SAGES置于SSAGS SAGENT上。我们介绍构建复杂推理工作流程,将它们部署到sagemaker端点的示例,并调用它们进行实时推理。我们还展示了像亚马逊搜索计划的客户如何使用SageMaker推理工作流程为亚马逊购物者提供更相关的搜索结果。无论您是构建一个简单的两步过程还是复杂的多模式AI应用程序,此新功能都提供了您所需的工具来使您的视野栩栩如生。该工具旨在使开发人员和企业可以轻松创建和管理复杂的AI系统,帮助他们构建更强大,更有效的AI应用程序。在以下各节中,我们更深入地深入研究