详细内容或原文请订阅后点击阅览
使用 Amazon Bedrock 全球跨区域推理和 Anthropic Claude 4.5 模型扩展南非的 AI
在本文中,我们将介绍全局跨区域推理如何路由请求以及数据驻留在何处,然后向您展示如何配置所需的 AWS Identity and Access Management (IAM) 权限并使用全局推理配置文件 Amazon 资源名称 (ARN) 调用 Claude 4.5 模型。我们还介绍了如何请求增加工作负载的配额。最后,您将在 af-south-1 中实现全局跨区域推理。
来源:亚马逊云科技 _机器学习使用 Amazon Bedrock 构建 AI 应用程序会带来吞吐量挑战,影响应用程序的可扩展性。 af-south-1 AWS 区域中的全局跨区域推理改变了这一点。您现在可以从开普敦区域调用模型,而 Amazon Bedrock 会自动将请求路由到具有可用容量的区域。您的应用程序可以获得一致的响应时间,您的用户可以获得可靠的体验,并且您的 Amazon CloudWatch 和 AWS CloudTrail 日志集中在 af-south-1 中。
在开普敦地区 (af-south-1) 的 Amazon Bedrock 上使用 Anthropic Claude Sonnet 4.5、Haiku 4.5 和 Opus 4.5 进行全球跨区域推理,您可以访问 Claude 4.5 模型系列。南非客户现在可以使用全局推理配置文件来访问这些模型,从而提高吞吐量和弹性。全球跨区域推理将请求路由到全球受支持的商业区域,优化资源并实现更高的吞吐量——在高峰使用时间尤其有价值。 该功能支持 Amazon Bedrock 提示缓存、批量推理、Amazon Bedrock Guardrails、Amazon Bedrock 知识库等。
在本文中,我们将介绍全局跨区域推理如何路由请求以及数据驻留在何处,然后向您展示如何配置所需的 AWS Identity and Access Management (IAM) 权限并使用全局推理配置文件 Amazon 资源名称 (ARN) 调用 Claude 4.5 模型。我们还介绍了如何请求增加工作负载的配额。最后,您将在 af-south-1 中实现全局跨区域推理。
了解跨区域推理
跨区域推理是一项强大的功能,组织可以使用它在多个区域之间无缝分配推理处理。此功能可帮助您在大规模构建时获得更高的吞吐量,从而使您的生成式 AI 应用程序即使在重负载下也能保持响应灵敏且可靠。
