AWS Adds Multi-Region Replication to Amazon Cognito Identity Service
AWS 最近推出了 Amazon Cognito 多区域复制,该功能可自动将用户身份和用户池配置从主要区域复制到辅助区域。这使得应用程序能够在中断期间继续对副本区域的用户进行身份验证,而无需自定义复制和故障转移机制。作者:雷纳托·洛西奥
Introducing container caching in Amazon SageMaker AI for faster model scaling
今天,我们很高兴地宣布用于 Amazon SageMaker AI 推理的容器映像缓存,这是我们更快的扩展优化之旅的下一个重大进展。这使得生成式 AI 模型在横向扩展事件期间的端到端延迟速度提高了 2 倍。
Parallelize speculative decoding with P-EAGLE on Amazon SageMaker AI
本文将引导您了解如何直接在 Amazon SageMaker AI 中使用 P-EAGLE。它将演示如何从 SageMaker JumpStart 目录中选择兼容模型、配置并行绘图规范以及部署高度优化的实时 SageMaker AI 端点以加速您的生成式 AI 应用程序。
Introducing Gemma 4 models on Amazon Bedrock
今天,我们宣布 Gemma 4 系列在 Amazon Bedrock 上上市。 Gemma 4 由 Google DeepMind 构建并在 Apache 2.0 许可下发布,是一系列开放权重模型,其设计重点是跨广泛部署场景的每参数智能。该系列包括三个指令调整变体:Gemma 4 31B、Gemma 4 26B-A4B 和 Gemma 4 E2B。这些涵盖密集和专家混合 (MoE) 架构,其中每个请求仅激活模型参数的一小部分。这些变体提供内置推理、本机函数调用以及跨文本和图像的多模式输入。
Amarnath Yatra can help defeat hate, mistrust: Mehbooba Mufti
前查谟和克什米尔首席部长 Mehbooba Mufti 认为,Amarnath Yatra 和旅游业为克什米尔人提供了对抗仇恨和不信任的机会。她敦促当地人确保每位朝圣者和游客都感到受欢迎、尊重和保护。穆夫提强调,积极的经历将使游客成为真正的大使,在印度各地分享克什米尔的温暖和人性的真实故事。
Build a meeting prep and follow-up assistant with Amazon Quick and Cisco Webex MCP servers
本文展示了如何使用 Amazon Quick 和 Cisco Webex MCP 服务器构建自定义会议准备和后续助理。根据单个提示,客服人员可以找到即将召开的 Webex 会议,查看之前的会议摘要和文字记录,并提取相关的 Vidcast 亮点和文字记录上下文。然后,它会在 Webex 消息线程中搜索未解决的后续问题,并创建简洁的准备摘要。会议结束后,同一位助理可以总结讨论并确定行动项目。它还可以查找相关的 Vidcast 更新并为正确的 Webex 空间起草后续消息。
Spot trends faster, sort smarter: Unlocking Sparklines and Custom Sort in Amazon Quick
今天,我们很高兴地宣布两项新功能,使 Quick Sight 仪表板更具表现力和业务一致性:迷你图和控件的自定义排序。在这篇文章中,我们将介绍这两个功能、它们是什么、何时使用它们以及如何配置它们,并通过真实场景将它们整合到一个实用的、可供决策的仪表板中。
在这篇文章中,我们演示了免提 FNOL 引入系统如何将使用 Strands Agents SDK 构建的用于域推理的代理与用于实时门户交互的 Amazon Bedrock AgentCore 浏览器工具结合起来。这种方法保留了人类的专业知识,同时消除了重复的屏幕工作。
Scale Robot Reinforcement Learning with NVIDIA Isaac Lab on Amazon SageMaker AI
在这篇文章中,我们展示了如何在 Amazon SageMaker AI 上使用 NVIDIA Isaac Lab 跨两个计算选项训练 Unitree H1 人形机器人策略:Amazon SageMaker HyperPod 和 Amazon SageMaker 训练作业。
Build an agentic incident triage assistant with Amazon Quick and New Relic
这篇文章向工程团队展示了如何将该原则应用于工程中对时间最敏感的工作流程之一:事件分类。您将使用 Amazon Quick 构建自定义事件分类助理代理,通过本机集成协调 New Relic 模型上下文协议 (MCP) 服务器和 Asana 的响应。根据单一提示,Amazon Quick 代理即可调查该事件,汇总带有证据链接的根本原因分析 (RCA) 简介,并创建一个可跟踪的 Asana 任务以供移交。
Amazon Prime members can buy a car online now - and get a $1,500 gift card
亚马逊现在正在与当地经销商合作,帮助您购买、出售或租赁您的汽车 - Prime 会员可以在合作时获得一张大礼品卡。
It’s safe to close your laptop now: Hosting coding agents on Amazon Bedrock AgentCore
Amazon Bedrock AgentCore Runtime 为每个代理会话提供自己独立的 microVM,其中包含持久工作区、通过网关的安全工具访问以及内置可观察性,因此您可以并行运行 Claude Code、Codex、Kiro 和 Cursor,而无需共享机密、端口或文件系统。盖上盖子,去吃晚饭,明天再从上次停下的地方继续。
NVIDIA Nemotron 3 Ultra now available on Amazon SageMaker JumpStart
在 Amazon SageMaker JumpStart 上部署 NVIDIA Nemotron 3 Ultra。借助此前沿推理模型,代理 AI 工作负载的推理速度提高 5 倍,成本降低 30%。
Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI
在本文中,您将了解如何结合使用监督微调 (SFT) 和直接偏好优化 (DPO) 来提高小型语言模型 (SLM) 的工具调用准确性。该示例使用 Amazon SageMaker AI 训练作业,因此您可以专注于训练代码,而不是管理自己的训练基础设施。您还将学习如何评估工具调用的准确性,并将基本模型与多个微调变体进行比较,以便您可以就模型质量做出数据驱动的决策。
How to build self-driving AI operations on Amazon Bedrock at scale
在这篇文章中,我们介绍 Amazon Bedrock Ops Alert,这是一种三层自动化监控解决方案,可主动检测操作问题、动态调整警报阈值、按类别对警报进行分类、自动创建上下文感知支持案例、在同一警报类别的未解决案例已处于活动状态时帮助防止重复案例,并向 AI SRE 团队提供情境化通知。我们将介绍解决方案架构以及如何将其部署在您自己的环境中。
Fundamental’s Large Tabular Model NEXUS is now available on Amazon SageMaker JumpStart
在本文中,我们将向您展示如何在 Amazon SageMaker JumpStart 上开始使用 NEXUS、逐步完成部署过程,并演示如何针对企业数据集运行预测。
The art and science of hyperparameter optimization on Amazon Nova Forge
针对特定领域的任务进行微调意味着在不降低模型总体能力的情况下提高某一领域的性能,而实现这种平衡比看起来更难。这篇文章将介绍如何实现这种平衡,从为数据和任务选择正确的定制策略,到配置最影响结果的训练参数,例如学习率、批量大小和检查点。我们还介绍了导致训练运行浪费的常见错误以及如何及早发现这些错误,以便您可以提高域性能,而不会降低一般功能或因可避免的故障而消耗计算资源。最后,您将了解如何在不降低一般功能的情况下提高域性能,以及如何避免因平衡错误而导致代价高昂的故障。
How Baz improved its AI Agent Code Review accuracy using Amazon Bedrock AgentCore
本文介绍了 Baz 如何使用 Amazon Bedrock 和 Amazon Bedrock AgentCore 构建其 Spec Review 代理。我们将介绍架构决策、实施细节以及他们通过利用这些 AWS 服务自动化代码审查流程所实现的业务成果