Efficiently serve dozens of fine-tuned models with vLLM on Amazon SageMaker AI and Amazon Bedrock
在这篇文章中,我们将解释如何在 vLLM 中为专家混合 (MoE) 模型实现多 LoRA 推理,描述我们执行的内核级优化,并向您展示如何从这项工作中受益。我们在这篇文章中使用 GPT-OSS 20B 作为我们的主要示例。
Building intelligent event agents using Amazon Bedrock AgentCore and Amazon Bedrock Knowledge Bases
本文演示了如何使用 Amazon Bedrock AgentCore 组件快速部署生产就绪的事件助手。我们将构建一个智能伴侣,它可以记住与会者的偏好并随着时间的推移构建个性化体验,而 Amazon Bedrock AgentCore 则负责处理生产部署的繁重工作:Amazon Bedrock AgentCore Memory 用于维护对话上下文和长期偏好,无需自定义存储解决方案;Amazon Bedrock AgentCore Identity 用于安全的多 IDP 身份验证;Amazon Bedrock AgentCore Runtime 用于无服务器扩展和会话隔离。我们还将使用 Amazo
我们很高兴地宣布,Anthropic 的 Claude Opus 4.6、Claude Sonnet 4.6、Claude Opus 4.5、Claude Sonnet 4.5 和 Claude Haiku 4.5 通过 Amazon Bedrock 全球跨区域推理向中东运营的客户推出。在这篇文章中,我们将引导您了解每个 Anthropic Claude 模型变体的功能、全局跨区域推理的主要优势(包括提高的弹性)、您可以实现的实际用例,以及帮助您立即开始构建生成式 AI 应用程序的代码示例。
AI meets HR: Transforming talent acquisition with Amazon Bedrock
在这篇文章中,我们展示了如何使用 Amazon Bedrock、Amazon Bedrock 知识库、AWS Lambda 和其他 AWS 服务创建人工智能驱动的招聘系统,以增强职位描述创建、候选人沟通和面试准备,同时保持人工监督。
Scaling data annotation using vision-language models to power physical AI systems
在这篇文章中,我们研究了 Bedrock Robotics 如何应对这一挑战。通过加入 AWS 物理 AI 奖学金,该初创公司与 AWS 生成 AI 创新中心合作,应用视觉语言模型来分析施工视频片段、提取操作细节并大规模生成标记的训练数据集,以改进自主施工设备的数据准备。
Evaluating AI agents: Real-world lessons from building agentic systems at Amazon
在这篇文章中,我们提出了一个针对 Amazon 代理 AI 系统的综合评估框架,该框架通过两个核心组件解决了 Amazon 代理 AI 应用程序的复杂性:一个通用评估工作流程,用于标准化不同代理实施中的评估程序;以及一个代理评估库,该库在 Amazon Bedrock AgentCore 评估中提供系统测量和指标,以及 Amazon 使用案例特定的评估方法和指标。
Build unified intelligence with Amazon Bedrock AgentCore
在这篇文章中,我们将演示如何通过客户代理和知识引擎 (CAKE) 的实际实施,使用 Amazon Bedrock AgentCore 构建统一智能系统。
Cracks in the Bedrock: Bypassing SCP Enforcement with Long-Lived API Keys
简介 在发布由 AWS Mantle 提供支持的 Amazon Bedrock 后,我发现了一种绕过限制使用 bedrock-mantle IAM 权限的服务控制策略 (SCP) 语句的机制。通过利用由服务特定凭证支持的长期 API 密钥,我能够成功利用 bedrock-mantle:CreateInference,尽管 SCP 声明否认了该操作。 SCP 是 [...]
Swann provides Generative AI to millions of IoT Devices using Amazon Bedrock
本文向您展示如何使用 Amazon Bedrock 及其 gen-AI 功能实施智能通知过滤。您将学习模型选择策略、成本优化技术以及基于 Swann Communications 在数百万设备上部署的物联网规模部署 gen-AI 的架构模式。
Mastering Amazon Bedrock throttling and service availability: A comprehensive guide
本文向您展示如何实施强大的错误处理策略,以帮助提高使用 Amazon Bedrock 时的应用程序可靠性和用户体验。我们将深入探讨优化具有这些错误的应用程序性能的策略。无论这是一个相当新的应用程序还是成熟的人工智能应用程序,在这篇文章中,您将能够找到针对这些错误进行操作的实用指南。
在这篇文章中,我们讨论如何使用 Amazon NovainAmazon Bedrock 来实施人工智能驱动的图像识别解决方案,该解决方案可自动检测和验证模块组件,从而显着减少手动验证工作并提高准确性。
Iberdrola enhances IT operations using Amazon Bedrock AgentCore
Iberdrola 是全球最大的公用事业公司之一,它采用了尖端的人工智能技术来彻底改变其 ServiceNow 的 IT 运营。通过与 AWS 的合作,Iberdrola 使用 Amazon Bedrock AgentCore 实施了不同的代理架构,针对三个关键领域:在草稿阶段优化变更请求验证、通过上下文智能丰富事件管理以及使用对话式 AI 简化变更模型选择。这些创新减少了瓶颈,帮助团队加快故障单解决速度,并在整个组织内提供一致且高质量的数据处理。
在本文中,您将了解如何将 Fullstack AgentCore 解决方案模板 (FAST) 部署到您的 Amazon Web Services (AWS) 账户,了解其架构,并了解如何根据您的需求扩展它。您将学习如何构建自己的代理,同时 FAST 处理身份验证、基础设施即代码 (IaC)、部署管道和服务集成。
AI-Powered App Modernization with Amazon
为什么重要:了解 Amazon AI 驱动的应用程序现代化如何使用 Bedrock 和生成式 AI 简化遗留系统。
How Associa transforms document classification with the GenAI IDP Accelerator and Amazon Bedrock
Associa 与 AWS 生成式 AI 创新中心合作,构建了生成式 AI 驱动的文档分类系统,符合 Associa 使用生成式 AI 提高文档管理运营效率的长期愿景。该解决方案可以高精度地自动对传入文档进行分类,高效处理文档,并在保持卓越运营的同时节省大量成本。该文档分类系统使用生成式人工智能智能文档处理 (GenAI IDP) 加速器开发,旨在无缝集成到现有工作流程中。它通过减少手动分类任务所花费的时间,彻底改变了员工与文档管理系统的交互方式。
AI agents in enterprises: Best practices with Amazon Bedrock AgentCore
本文探讨了使用 Amazon Bedrock AgentCore 构建企业 AI 代理的九个基本最佳实践。 Amazon Bedrock AgentCore 是一个代理平台,可为您提供大规模创建、部署和管理 AI 代理所需的服务。在这篇文章中,我们涵盖了从初始范围界定到组织扩展的所有内容,并提供了您可以立即应用的实用指南。
BGL 是自我管理养老金 (SMSF) 管理解决方案的领先提供商,帮助个人管理自己或客户退休储蓄的复杂合规性和报告,为 15 个国家/地区的 12,700 多家企业提供服务。在这篇博文中,我们探讨了 BGL 如何使用 Claude Agent SDK 和 Amazon Bedrock AgentCore 构建其可用于生产的 AI 代理。