详细内容或原文请订阅后点击阅览
Amazon SageMaker AI 端点的增强指标:更深入的可见性以实现更好的性能
SageMaker AI 端点现在支持具有可配置发布频率的增强指标。此次发布提供了监控、故障排除和改进生产端点所需的精细可见性。
来源:亚马逊云科技 _机器学习在生产中运行机器学习 (ML) 模型需要的不仅仅是基础设施弹性和扩展效率。您需要近乎持续地了解性能和资源利用率。当延迟增加、调用失败或资源受到限制时,您需要立即洞察以诊断并解决问题,以免影响客户。
到目前为止,Amazon SageMaker AI 提供的 Amazon CloudWatch 指标可提供有用的高级可见性,但这些指标是跨所有实例和容器的聚合指标。虽然有助于整体运行状况监控,但这些聚合指标掩盖了单个实例和容器的详细信息,导致难以查明瓶颈、提高资源利用率或有效排除故障。
SageMaker AI 端点现在支持具有可配置发布频率的增强指标。此次发布提供了监控、故障排除和改进生产端点所需的精细可见性。借助 SageMaker AI 端点增强指标,我们现在可以深入了解容器级和实例级指标,这些指标提供以下功能:
新增内容
增强的指标引入了两类具有多个粒度级别的指标:
