详细内容或原文请订阅后点击阅览
使用 SageMaker AI 模型和 MLflow 构建 Strands 代理
在这篇文章中,我们演示了如何使用 Strands Agents SDK 以及部署在 SageMaker AI 端点上的模型来构建 AI 代理。您将了解如何从 SageMaker JumpStart 部署基础模型,将其与 Strands Agent 集成,以及使用 SageMaker Serverless MLflow 进行代理跟踪建立生产级可观测性。我们还介绍了如何跨多个模型变体实施 A/B 测试,使用 MLflow 指标评估代理性能,并展示如何在您控制的基础设施上构建、部署和持续改进 AI 代理。
来源:亚马逊云科技 _机器学习构建 AI 代理的企业通常需要的不仅仅是托管基础模型 (FM) 服务所能提供的。他们需要精确控制性能调整、大规模成本优化、合规性和数据驻留、模型选择以及与现有安全架构集成的网络配置。Amazon SageMaker AI 端点通过让组织能够控制计算资源、扩展行为和基础设施布局来满足这些要求,同时受益于 AWS 的托管操作层。这些由 SageMaker AI 部署的模型可以为 AI 代理提供支持,处理会话工作负载,并与 Amazon Bedrock 上提供的 FM 等编排框架集成。不同之处在于,组织保留了对推理发生方式和地点的架构控制。
在这篇文章中,我们演示了如何使用 Strands Agents SDK 以及部署在 SageMaker AI 端点上的模型来构建 AI 代理。您将了解如何从 SageMaker JumpStart 部署基础模型,将其与 Strands Agent 集成,以及使用 SageMaker Serverless MLflow 进行代理跟踪建立生产级可观测性。我们还介绍了如何跨多个模型变体实施 A/B 测试,使用 MLflow 指标评估代理性能,并展示如何在您控制的基础设施上构建、部署和持续改进 AI 代理。
Strands Agents SDK 是一款开源 SDK,它采用模型驱动的方法,只需几行代码即可构建和运行 AI 代理。 Strands 从简单到复杂的代理用例,从本地开发到生产中的部署。
Amazon SageMaker JumpStart 是一个机器学习 (ML) 中心,可以帮助您加速 ML 之旅。借助 SageMaker JumpStart,您可以根据预定义的质量和责任指标快速评估、比较和选择 FM 来执行文章摘要和图像生成等任务。
在这篇文章中,我们:
