SageMaker JumpStart 上基于用例的部署

我们很高兴地宣布推出 Amazon SageMaker JumpStart 优化部署。 SageMaker JumpStart 改进的部署通过提供专为特定用例设计的预定义部署配置,满足了 SageMaker JumpStart 上丰富且简单的部署自定义的需求。客户对其建议部署的细节保持相同级别的可见性,但现在部署针对其特定用例和性能限制进行了优化。

来源:亚马逊云科技 _机器学习

Amazon SageMaker JumpStart 为各种问题类型提供预训练模型,帮助您开始使用 AI 工作负载。 SageMaker JumpStart 提供对顶级用例的解决方案的访问,这些解决方案可以部署到 SageMaker AI 托管推理端点或 SageMaker HyperPod 集群。通过预设的部署选项,客户可以快速从模型选择转向模型部署。

通过 SageMaker JumpStart 进行模型部署既快速又简单。客户可以根据预期并发用户来选择选项,并了解 P50 延迟、首次令牌时间 (TTFT) 和吞吐量(令牌/第二/用户)。虽然并发用户配置选项对通用场景很有帮助,但它们没有任务感知能力,我们认识到客户将 SageMaker JumpStart 用于各种特定的用例,例如内容生成、内容摘要或问答。每个用例可能需要特定的配置来提高性能。此外,性能的定义不仅仅局限于延迟,一些客户可能会以吞吐量或每个令牌的最低成本来衡量性能。

在此基础上,我们很高兴地宣布推出 SageMaker JumpStart 优化部署。 SageMaker JumpStart 改进的部署通过提供专为特定用例设计的预定义部署配置,满足了 SageMaker JumpStart 上丰富且简单的部署自定义的需求。客户对其建议部署的细节保持相同级别的可见性,但现在部署针对其特定用例和性能限制进行了优化。

先决条件

要开始使用 SageMaker JumpStart 优化部署,客户至少需要以下内容:

这些功能到位后,客户可以立即开始使用 SageMaker JumpStart 优化部署。

开始使用

可用型号

SageMaker JumpStart 优化部署适用于以下型号:

  • 微软