详细内容或原文请订阅后点击阅览
SageMaker JumpStart 上基于用例的部署
我们很高兴地宣布推出 Amazon SageMaker JumpStart 优化部署。 SageMaker JumpStart 改进的部署通过提供专为特定用例设计的预定义部署配置,满足了 SageMaker JumpStart 上丰富且简单的部署自定义的需求。客户对其建议部署的细节保持相同级别的可见性,但现在部署针对其特定用例和性能限制进行了优化。
来源:亚马逊云科技 _机器学习Amazon SageMaker JumpStart 为各种问题类型提供预训练模型,帮助您开始使用 AI 工作负载。 SageMaker JumpStart 提供对顶级用例的解决方案的访问,这些解决方案可以部署到 SageMaker AI 托管推理端点或 SageMaker HyperPod 集群。通过预设的部署选项,客户可以快速从模型选择转向模型部署。
通过 SageMaker JumpStart 进行模型部署既快速又简单。客户可以根据预期并发用户来选择选项,并了解 P50 延迟、首次令牌时间 (TTFT) 和吞吐量(令牌/第二/用户)。虽然并发用户配置选项对通用场景很有帮助,但它们没有任务感知能力,我们认识到客户将 SageMaker JumpStart 用于各种特定的用例,例如内容生成、内容摘要或问答。每个用例可能需要特定的配置来提高性能。此外,性能的定义不仅仅局限于延迟,一些客户可能会以吞吐量或每个令牌的最低成本来衡量性能。
在此基础上,我们很高兴地宣布推出 SageMaker JumpStart 优化部署。 SageMaker JumpStart 改进的部署通过提供专为特定用例设计的预定义部署配置,满足了 SageMaker JumpStart 上丰富且简单的部署自定义的需求。客户对其建议部署的细节保持相同级别的可见性,但现在部署针对其特定用例和性能限制进行了优化。
先决条件
要开始使用 SageMaker JumpStart 优化部署,客户至少需要以下内容:
这些功能到位后,客户可以立即开始使用 SageMaker JumpStart 优化部署。
开始使用
可用型号
SageMaker JumpStart 优化部署适用于以下型号:
