横向收缩关键词检索结果

容量感知推理:SageMaker AI 端点的自动实例回退

Capacity-aware inference: Automatic instance fallback for SageMaker AI endpoints

今天,Amazon SageMaker AI 为新的和现有的推理终端节点引入了容量感知实例池。您定义实例类型的优先级列表,只要在创建、横向扩展和横向收缩期间容量受到限制,SageMaker AI 就会自动处理您的列表。您的端点无需人工干预即可配置可用的人工智能基础设施。此功能适用于单模型端点、基于推理组件的端点和异步推理端点。