Improve your agent’s tool-calling accuracy with SFT and DPO on Amazon SageMaker AI
在本文中,您将了解如何结合使用监督微调 (SFT) 和直接偏好优化 (DPO) 来提高小型语言模型 (SLM) 的工具调用准确性。该示例使用 Amazon SageMaker AI 训练作业,因此您可以专注于训练代码,而不是管理自己的训练基础设施。您还将学习如何评估工具调用的准确性,并将基本模型与多个微调变体进行比较,以便您可以就模型质量做出数据驱动的决策。
How to build self-driving AI operations on Amazon Bedrock at scale
在这篇文章中,我们介绍 Amazon Bedrock Ops Alert,这是一种三层自动化监控解决方案,可主动检测操作问题、动态调整警报阈值、按类别对警报进行分类、自动创建上下文感知支持案例、在同一警报类别的未解决案例已处于活动状态时帮助防止重复案例,并向 AI SRE 团队提供情境化通知。我们将介绍解决方案架构以及如何将其部署在您自己的环境中。
Fundamental’s Large Tabular Model NEXUS is now available on Amazon SageMaker JumpStart
在本文中,我们将向您展示如何在 Amazon SageMaker JumpStart 上开始使用 NEXUS、逐步完成部署过程,并演示如何针对企业数据集运行预测。
Marines Have been Coughing Blood Clearing Buildings in Ramadi
拉马迪迫使海军陆战队陷入不可能的境地。烟雾缭绕的建筑物。爆炸残留物悬浮在空气中。战士们利用清真寺作为掩护,因为他们了解清真寺造成的犹豫。乔什·肖尔斯 (Josh Shores) 谈论了伊拉克斗争中的紧张、混乱和瞬间选择。 🎙️ 完整的《战斗故事》剧集现已播出:https://youtu.be/bg5palVpd-g 🎙️ 访客 — Joshua “Josh” Shores 海军陆战队步兵退伍军人、紫冠心病接受者、前海军陆战队员、退休消防员和《依靠生命的损失》的作者。 🔗 https://www.countingondeath.com 📸 https://www.instagram.com/jo
We found this fake-invoice campaign while scammers were still building it
冒充来自 Amazon、PayPal 和其他公司的发票揭示了犯罪分子如何利用恐惧和电话来窃取金钱和设备。
The art and science of hyperparameter optimization on Amazon Nova Forge
针对特定领域的任务进行微调意味着在不降低模型总体能力的情况下提高某一领域的性能,而实现这种平衡比看起来更难。这篇文章将介绍如何实现这种平衡,从为数据和任务选择正确的定制策略,到配置最影响结果的训练参数,例如学习率、批量大小和检查点。我们还介绍了导致训练运行浪费的常见错误以及如何及早发现这些错误,以便您可以提高域性能,而不会降低一般功能或因可避免的故障而消耗计算资源。最后,您将了解如何在不降低一般功能的情况下提高域性能,以及如何避免因平衡错误而导致代价高昂的故障。
How Baz improved its AI Agent Code Review accuracy using Amazon Bedrock AgentCore
本文介绍了 Baz 如何使用 Amazon Bedrock 和 Amazon Bedrock AgentCore 构建其 Spec Review 代理。我们将介绍架构决策、实施细节以及他们通过利用这些 AWS 服务自动化代码审查流程所实现的业务成果
如果您正在 AWS GPU 实例上迭代部署大型语言模型 (LLM),您可能已经注意到要加载到 GPU 高带宽内存 (HBM) 中的模型越大,GPU 准备好进行推理之前的痛苦等待时间就越长。随着模型增长到数千亿个参数,GPU 环境不断增长 [...]
AgentOps: Operationalize agentic AI at scale with Amazon Bedrock AgentCore
当您构建代理 AI 解决方案时,您会面临独特的运营挑战。代理会做出不可预测的决策,成本会意外上升,并且调试非确定性故障似乎是不可能的。代理人工智能应用程序不仅仅执行预定的工作流程。他们推理、适应并做出自主决策,并且 DevOps 实践需要进行调整。这就是 AgentOps 的用武之地,它是在生产中部署、管理和持续改进 AI 代理的操作规程。
Amazon Quick integration with time-series databases for market intelligence using MCP
在这篇文章中,我们将介绍使用 KDB-X MCP 服务器与 Amazon Quick 集成的实际实施,演示交易者和分析师如何使用对话语言提出问题并从数据集中获取可操作的见解。您可以在各个领域应用相同的集成模式,从金融市场分析到物联网传感器监控,再到 DevOps 性能仪表板,您需要在这些领域简化对时间序列见解的访问。
OpenAI models and Codex on Amazon Bedrock are now generally available
GPT-5.5、GPT-5.4 和 Codex 现已在 Amazon Bedrock 上全面提供。立即将它们部署在 Bedrock 的高性能推理引擎上的生产应用程序和代理中。
Enable safe agentic payments with built-in guardrails using Amazon Bedrock AgentCore payments
在这篇文章中,我们解决了设计代理支付系统时出现的几个关键风险,以及如何使用 AgentCore 支付功能来解决这些风险。
Has Prime Air become Amazon Air Cargo?
一架新的波音 767-300F (N496MM) 现已由 AmeriJet International 为亚马逊运营。该飞机现在不再带有通常的 Prime Air 标题,而是带有“Amazon Air Cargo”标题。亚马逊航空货运公司对自己的描述是:100 多架飞机。每天 250 多个航班。每周 7 天。现在,可以自助访问即时报价、快速预订和实时跟踪 — 所有这些 [...]
Building AI agents for business support using Amazon Bedrock AgentCore
在这篇文章中,我们将分享 AWS 生成式 AI 创新中心 (GenAIIC) 如何与 Works Human Intelligence (WHI) 合作使用 Amazon Bedrock AgentCore 构建两个 AI 代理。我们讨论了遇到的挑战以及在提高运营效率的同时降低成本高达 97% 的解决方案。
Training Azerbaijani language models on Amazon SageMaker AI
Azercell Telecom LLC 是阿塞拜疆领先的电信提供商,希望在 Amazon SageMaker AI 上针对电信用例和面向客户的聊天机器人构建阿塞拜疆大语言模型 (LLM)。挑战:使基础模型 (FM) 适应形态丰富的语言,但训练数据有限,而且阿塞拜疆没有现有的高效法学硕士培训蓝图。在为期六周的合作中,Azercell 与 AWS Generative AI 创新中心合作,在 Amazon SageMaker AI 上建立了一个生产就绪框架。
Streamline external access to Amazon SageMaker MLflow using a REST API proxy
在本文中,我们演示如何构建基于 Flask 的安全 MLflow 代理服务,该服务提供对 Amazon SageMaker MLflow 的 HTTPS 访问,而无需 MLflow SDK。该解决方案适用于正在进行云转型、希望在采用云原生服务的同时保留现有机器学习工作流程的组织。
本文演示了使用 Amazon Managed Grafana 仪表板的综合可观测性解决方案,该仪表板通过推理组件为 Amazon SageMaker AI 终端节点上提供的 LLM 提供质量和数量的整体视图。
Automate AML alert triage with Amazon Quick and Snowflake Cortex AI
这篇文章展示了通过自动化金融服务中劳动最密集的工作流程之一来实现集成:反洗钱 (AML) 警报分类。您将使用 Amazon Quick Flows 和 Snowflake Cortex 构建分类工作流程,并通过 Amazon Quick Model Context Protocol (MCP) 集成进行连接。在我们的测试环境中,使用 Amazon Quick 构建的自动化工作流程将警报调查时间从 30-90 分钟减少到 5 分钟以下。实际结果可能会因警报复杂性和数据量而异。