azo关键词检索结果

使用 Amazon FSx for Lustre 和 TurboQuant 上的 GPUDirect 加速 LLM 模型加载并增加上下文窗口

Accelerate LLM model loading and increase context windows with GPUDirect on Amazon FSx for Lustre and TurboQuant

如果您正在 AWS GPU 实例上迭代部署大型语言模型 (LLM),您可能已经注意到要加载到 GPU 高带宽内存 (HBM) 中的模型越大,GPU 准备好进行推理之前的痛苦等待时间就越长。随着模型增长到数千亿个参数,GPU 环境不断增长 [...]

AgentOps:使用 Amazon Bedrock AgentCore 大规模运营代理 AI

AgentOps: Operationalize agentic AI at scale with Amazon Bedrock AgentCore

当您构建代理 AI 解决方案时,您会面临独特的运营挑战。代理会做出不可预测的决策,成本会意外上升,并且调试非确定性故障似乎是不可能的。代理人工智能应用程序不仅仅执行预定的工作流程。他们推理、适应并做出自主决策,并且 DevOps 实践需要进行调整。这就是 AgentOps 的用武之地,它是在生产中部署、管理和持续改进 AI 代理的操作规程。

Amazon 使用 MCP 与时间序列数据库快速集成以获取市场情报

Amazon Quick integration with time-series databases for market intelligence using MCP

在这篇文章中,我们将介绍使用 KDB-X MCP 服务器与 Amazon Quick 集成的实际实施,演示交易者和分析师如何使用对话语言提出问题并从数据集中获取可操作的见解。您可以在各个领域应用相同的集成模式,从金融市场分析到物联网传感器监控,再到 DevOps 性能仪表板,您需要在这些领域简化对时间序列见解的访问。

Amazon Bedrock 上的 OpenAI 模型和 Codex 现已全面可用

OpenAI models and Codex on Amazon Bedrock are now generally available

GPT-5.5、GPT-5.4 和 Codex 现已在 Amazon Bedrock 上全面提供。立即将它们部署在 Bedrock 的高性能推理引擎上的生产应用程序和代理中。

使用 Amazon Bedrock AgentCore 付款通过内置护栏实现安全代理付款

Enable safe agentic payments with built-in guardrails using Amazon Bedrock AgentCore payments

在这篇文章中,我们解决了设计代理支付系统时出现的几个关键风险,以及如何使用 AgentCore 支付功能来解决这些风险。

使用 Amazon Bedrock AgentCore 构建 AI 代理以提供业务支持

Building AI agents for business support using Amazon Bedrock AgentCore

在这篇文章中,我们将分享 AWS 生成式 AI 创新中心 (GenAIIC) 如何与 Works Human Intelligence (WHI) 合作使用 Amazon Bedrock AgentCore 构建两个 AI 代理。我们讨论了遇到的挑战以及在提高运营效率的同时降低成本高达 97% 的解决方案。

在 Amazon SageMaker AI 上训练阿塞拜疆语语言模型

Training Azerbaijani language models on Amazon SageMaker AI

Azercell Telecom LLC 是阿塞拜疆领先的电信提供商,希望在 Amazon SageMaker AI 上针对电信用例和面向客户的聊天机器人构建阿塞拜疆大语言模型 (LLM)。挑战:使基础模型 (FM) 适应形态丰富的语言,但训练数据有限,而且阿塞拜疆没有现有的高效法学硕士培训蓝图。在为期六周的合作中,Azercell 与 AWS Generative AI 创新中心合作,在 Amazon SageMaker AI 上建立了一个生产就绪框架。

使用 REST API 代理简化对 Amazon SageMaker MLflow 的外部访问

Streamline external access to Amazon SageMaker MLflow using a REST API proxy

在本文中,我们演示如何构建基于 Flask 的安全 MLflow 代理服务,该服务提供对 Amazon SageMaker MLflow 的 HTTPS 访问,而无需 MLflow SDK。该解决方案适用于正在进行云转型、希望在采用云原生服务的同时保留现有机器学习工作流程的组织。

Amazon SageMaker AI LLM 推理的全面可观察性:从 GPU 利用率到 LLM 质量

Comprehensive observability for Amazon SageMaker AI LLM inference: From GPU utilization to LLM quality

本文演示了使用 Amazon Managed Grafana 仪表板的综合可观测性解决方案,该仪表板通过推理组件为 Amazon SageMaker AI 终端节点上提供的 LLM 提供质量和数量的整体视图。

使用 Amazon Quick 和 Snowflake Cortex AI 自动进行 AML 警报分类

Automate AML alert triage with Amazon Quick and Snowflake Cortex AI

这篇文章展示了通过自动化金融服务中劳动最密集的工作流程之一来实现集成:反洗钱 (AML) 警报分类。您将使用 Amazon Quick Flows 和 Snowflake Cortex 构建分类工作流程,并通过 Amazon Quick Model Context Protocol (MCP) 集成进行连接。在我们的测试环境中,使用 Amazon Quick 构建的自动化工作流程将警报调查时间从 30-90 分钟减少到 5 分钟以下。实际结果可能会因警报复杂性和数据量而异。

通过 Amazon Bedrock AgentCore 中的数据集管理构建可与代理一起成长的测试套件

Build a test suite that grows with your agent with dataset management in Amazon Bedrock AgentCore

当您将快速移动的在线信号与稳定的离线基线相结合时,代理评估最为强大。要了解您的代理是否真正随着时间的推移而改进,您需要一个固定的基准以及不断变化的现实世界流量。将评估基线的测试用例作为 Amazon Bedrock AgentCore 中的数据集进行管理,带来了版本化测试装置的规范 [...]

使用 Amazon Bedrock AgentCore 在 AWS 中构建高度可扩展的无服务器 LangGraph 多代理系统

Build highly scalable serverless LangGraph multi-agent systems in AWS with Amazon Bedrock AgentCore

在这篇文章中,我们提供了一种解决方案,可使用 LangGraph Agents 作为与 Amazon Bedrock AgentCore Memory 和 Amazon Bedrock AgentCore Observability 集成的编排器,在 AWS 上构建高度可扩展的无服务器多代理生成式 AI 系统。

为 Amazon Quick 构建企业可观测性解决方案

Build an enterprise observability solution for Amazon Quick

当成百上千的用户加入企业人工智能平台时,业务领导者和平台所有者需要了解谁在使用该平台、用户对他们收到的答案是否满意以及哪些功能推动了最大程度的参与。如果没有集中的可观测性解决方案,这些数据就会分散在多个 AWS [...]

使用 Strands Agents、NVIDIA NIM 和 Amazon Bedrock AgentCore 构建高性能生成式 AI 系统

Build high-performance generative AI systems with Strands Agents, NVIDIA NIM, and Amazon Bedrock AgentCore

在这篇文章中,您将学习如何构建一个多代理活动审核系统,该系统使用集成架构(结合了 NVIDIA NIM 进行 GPU 加速推理)来演示并行推理、上下文持久性和可追踪执行路径。 Amazon Bedrock AgentCore 提供托管运行时、共享内存和内置可观察性,Strands Agents 提供无服务器多代理编排。此方法支持生产环境中的性能、可扩展性和操作洞察力。虽然该示例侧重于营销内容审核,但相同的模式也适用于数字助理、审核自动化和检索增强生成管道。

Amazon Web Services 代理工具包简介

Introducing the Agent Toolkit for Amazon Web Services

这就像将您自己的私人专家 AWS 解决方案架构师和数据工程师合而为一。介绍 Amazon Web Services 的代理工具包一文首先出现在 Towards Data Science 上。

Amazon Nova Act 现已符合 HIPAA 要求

Amazon Nova Act is now HIPAA eligible

在这篇文章中,您将了解 Nova Act 提供的内容、HIPAA 资格如何适用于代理 AI 以及如何开始。

使用 Amazon Bedrock AgentCore 打破上下文窗口障碍

Break the context window barrier with Amazon Bedrock AgentCore

在本文中,您将了解如何使用 Amazon Bedrock AgentCore Code Interpreter 和 Strands Agents SDK 实施递归语言模型 (RLM)。最后,您将了解如何在上下文大小没有上限的情况下处理不同长度的文档,使用 Bedrock AgentCore Code Interpreter 作为迭代文档分析的持久工作内存,以及在沙盒 Python 环境中编排次大语言模型 (sub-LLM) 调用来分析特定文档部分。

宣布为 Amazon SageMaker AI 终端节点提供与 OpenAI 兼容的 API 支持

Announcing OpenAI-compatible API support for Amazon SageMaker AI endpoints

今天,Amazon SageMaker AI 推出了针对实时推理终端节点的 OpenAI 兼容 API 支持。如果您使用 OpenAI SDK、LangChain 或 Strands Agents,您现在可以通过仅更改端点 URL 来调用 SageMaker AI 上的模型。您不需要自定义客户端、SigV4 包装器或代码重写。概述 通过此次发布,SageMaker AI 端点 [...]