The art and science of hyperparameter optimization on Amazon Nova Forge
针对特定领域的任务进行微调意味着在不降低模型总体能力的情况下提高某一领域的性能,而实现这种平衡比看起来更难。这篇文章将介绍如何实现这种平衡,从为数据和任务选择正确的定制策略,到配置最影响结果的训练参数,例如学习率、批量大小和检查点。我们还介绍了导致训练运行浪费的常见错误以及如何及早发现这些错误,以便您可以提高域性能,而不会降低一般功能或因可避免的故障而消耗计算资源。最后,您将了解如何在不降低一般功能的情况下提高域性能,以及如何避免因平衡错误而导致代价高昂的故障。
How Baz improved its AI Agent Code Review accuracy using Amazon Bedrock AgentCore
本文介绍了 Baz 如何使用 Amazon Bedrock 和 Amazon Bedrock AgentCore 构建其 Spec Review 代理。我们将介绍架构决策、实施细节以及他们通过利用这些 AWS 服务自动化代码审查流程所实现的业务成果
如果您正在 AWS GPU 实例上迭代部署大型语言模型 (LLM),您可能已经注意到要加载到 GPU 高带宽内存 (HBM) 中的模型越大,GPU 准备好进行推理之前的痛苦等待时间就越长。随着模型增长到数千亿个参数,GPU 环境不断增长 [...]
AgentOps: Operationalize agentic AI at scale with Amazon Bedrock AgentCore
当您构建代理 AI 解决方案时,您会面临独特的运营挑战。代理会做出不可预测的决策,成本会意外上升,并且调试非确定性故障似乎是不可能的。代理人工智能应用程序不仅仅执行预定的工作流程。他们推理、适应并做出自主决策,并且 DevOps 实践需要进行调整。这就是 AgentOps 的用武之地,它是在生产中部署、管理和持续改进 AI 代理的操作规程。
Amazon Quick integration with time-series databases for market intelligence using MCP
在这篇文章中,我们将介绍使用 KDB-X MCP 服务器与 Amazon Quick 集成的实际实施,演示交易者和分析师如何使用对话语言提出问题并从数据集中获取可操作的见解。您可以在各个领域应用相同的集成模式,从金融市场分析到物联网传感器监控,再到 DevOps 性能仪表板,您需要在这些领域简化对时间序列见解的访问。
OpenAI models and Codex on Amazon Bedrock are now generally available
GPT-5.5、GPT-5.4 和 Codex 现已在 Amazon Bedrock 上全面提供。立即将它们部署在 Bedrock 的高性能推理引擎上的生产应用程序和代理中。
Enable safe agentic payments with built-in guardrails using Amazon Bedrock AgentCore payments
在这篇文章中,我们解决了设计代理支付系统时出现的几个关键风险,以及如何使用 AgentCore 支付功能来解决这些风险。
Building AI agents for business support using Amazon Bedrock AgentCore
在这篇文章中,我们将分享 AWS 生成式 AI 创新中心 (GenAIIC) 如何与 Works Human Intelligence (WHI) 合作使用 Amazon Bedrock AgentCore 构建两个 AI 代理。我们讨论了遇到的挑战以及在提高运营效率的同时降低成本高达 97% 的解决方案。
Training Azerbaijani language models on Amazon SageMaker AI
Azercell Telecom LLC 是阿塞拜疆领先的电信提供商,希望在 Amazon SageMaker AI 上针对电信用例和面向客户的聊天机器人构建阿塞拜疆大语言模型 (LLM)。挑战:使基础模型 (FM) 适应形态丰富的语言,但训练数据有限,而且阿塞拜疆没有现有的高效法学硕士培训蓝图。在为期六周的合作中,Azercell 与 AWS Generative AI 创新中心合作,在 Amazon SageMaker AI 上建立了一个生产就绪框架。
Streamline external access to Amazon SageMaker MLflow using a REST API proxy
在本文中,我们演示如何构建基于 Flask 的安全 MLflow 代理服务,该服务提供对 Amazon SageMaker MLflow 的 HTTPS 访问,而无需 MLflow SDK。该解决方案适用于正在进行云转型、希望在采用云原生服务的同时保留现有机器学习工作流程的组织。
本文演示了使用 Amazon Managed Grafana 仪表板的综合可观测性解决方案,该仪表板通过推理组件为 Amazon SageMaker AI 终端节点上提供的 LLM 提供质量和数量的整体视图。
Automate AML alert triage with Amazon Quick and Snowflake Cortex AI
这篇文章展示了通过自动化金融服务中劳动最密集的工作流程之一来实现集成:反洗钱 (AML) 警报分类。您将使用 Amazon Quick Flows 和 Snowflake Cortex 构建分类工作流程,并通过 Amazon Quick Model Context Protocol (MCP) 集成进行连接。在我们的测试环境中,使用 Amazon Quick 构建的自动化工作流程将警报调查时间从 30-90 分钟减少到 5 分钟以下。实际结果可能会因警报复杂性和数据量而异。
Build a test suite that grows with your agent with dataset management in Amazon Bedrock AgentCore
当您将快速移动的在线信号与稳定的离线基线相结合时,代理评估最为强大。要了解您的代理是否真正随着时间的推移而改进,您需要一个固定的基准以及不断变化的现实世界流量。将评估基线的测试用例作为 Amazon Bedrock AgentCore 中的数据集进行管理,带来了版本化测试装置的规范 [...]
Build highly scalable serverless LangGraph multi-agent systems in AWS with Amazon Bedrock AgentCore
在这篇文章中,我们提供了一种解决方案,可使用 LangGraph Agents 作为与 Amazon Bedrock AgentCore Memory 和 Amazon Bedrock AgentCore Observability 集成的编排器,在 AWS 上构建高度可扩展的无服务器多代理生成式 AI 系统。
Build an enterprise observability solution for Amazon Quick
当成百上千的用户加入企业人工智能平台时,业务领导者和平台所有者需要了解谁在使用该平台、用户对他们收到的答案是否满意以及哪些功能推动了最大程度的参与。如果没有集中的可观测性解决方案,这些数据就会分散在多个 AWS [...]
在这篇文章中,您将学习如何构建一个多代理活动审核系统,该系统使用集成架构(结合了 NVIDIA NIM 进行 GPU 加速推理)来演示并行推理、上下文持久性和可追踪执行路径。 Amazon Bedrock AgentCore 提供托管运行时、共享内存和内置可观察性,Strands Agents 提供无服务器多代理编排。此方法支持生产环境中的性能、可扩展性和操作洞察力。虽然该示例侧重于营销内容审核,但相同的模式也适用于数字助理、审核自动化和检索增强生成管道。
Introducing the Agent Toolkit for Amazon Web Services
这就像将您自己的私人专家 AWS 解决方案架构师和数据工程师合而为一。介绍 Amazon Web Services 的代理工具包一文首先出现在 Towards Data Science 上。
Amazon Nova Act is now HIPAA eligible
在这篇文章中,您将了解 Nova Act 提供的内容、HIPAA 资格如何适用于代理 AI 以及如何开始。