获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
Capacity-aware inference: Automatic instance fallback for SageMaker AI endpoints
今天,Amazon SageMaker AI 为新的和现有的推理终端节点引入了容量感知实例池。您定义实例类型的优先级列表,只要在创建、横向扩展和横向收缩期间容量受到限制,SageMaker AI 就会自动处理您的列表。您的端点无需人工干预即可配置可用的人工智能基础设施。此功能适用于单模型端点、基于推理组件的端点和异步推理端点。