亚马逊云科技 _机器学习领域信息情报检索---XiaoMi-AI

2026年6月1日 16:07

使用 Amazon FSx for Lustre 和 TurboQuant 上的 GPUDirect 加速 LLM 模型加载并增加上下文窗口

Accelerate LLM model loading and increase context windows with GPUDirect on Amazon FSx for Lustre and TurboQuant

如果您正在 AWS GPU 实例上迭代部署大型语言模型 (LLM)，您可能已经注意到要加载到 GPU 高带宽内存 (HBM) 中的模型越大，GPU 准备好进行推理之前的痛苦等待时间就越长。随着模型增长到数千亿个参数，GPU 环境不断增长 [...]

2026年6月1日 16:01

Amazon 使用 MCP 与时间序列数据库快速集成以获取市场情报

Amazon Quick integration with time-series databases for market intelligence using MCP

在这篇文章中，我们将介绍使用 KDB-X MCP 服务器与 Amazon Quick 集成的实际实施，演示交易者和分析师如何使用对话语言提出问题并从数据集中获取可操作的见解。您可以在各个领域应用相同的集成模式，从金融市场分析到物联网传感器监控，再到 DevOps 性能仪表板，您需要在这些领域简化对时间序列见解的访问。

2026年5月29日 23:36

Amazon SageMaker AI LLM 推理的全面可观察性：从 GPU 利用率到 LLM 质量

Comprehensive observability for Amazon SageMaker AI LLM inference: From GPU utilization to LLM quality

本文演示了使用 Amazon Managed Grafana 仪表板的综合可观测性解决方案，该仪表板通过推理组件为 Amazon SageMaker AI 终端节点上提供的 LLM 提供质量和数量的整体视图。

2026年5月28日 21:54

在 Amazon SageMaker AI 上训练阿塞拜疆语语言模型

Training Azerbaijani language models on Amazon SageMaker AI

Azercell Telecom LLC 是阿塞拜疆领先的电信提供商，希望在 Amazon SageMaker AI 上针对电信用例和面向客户的聊天机器人构建阿塞拜疆大语言模型 (LLM)。挑战：使基础模型 (FM) 适应形态丰富的语言，但训练数据有限，而且阿塞拜疆没有现有的高效法学硕士培训蓝图。在为期六周的合作中，Azercell 与 AWS Generative AI 创新中心合作，在 Amazon SageMaker AI 上建立了一个生产就绪框架。

2026年5月28日 20:35

使用 REST API 代理简化对 Amazon SageMaker MLflow 的外部访问

Streamline external access to Amazon SageMaker MLflow using a REST API proxy

在本文中，我们演示如何构建基于 Flask 的安全 MLflow 代理服务，该服务提供对 Amazon SageMaker MLflow 的 HTTPS 访问，而无需 MLflow SDK。该解决方案适用于正在进行云转型、希望在采用云原生服务的同时保留现有机器学习工作流程的组织。

2026年5月28日 18:10

通过 Amazon Bedrock AgentCore 中的数据集管理构建可与代理一起成长的测试套件

Build a test suite that grows with your agent with dataset management in Amazon Bedrock AgentCore

当您将快速移动的在线信号与稳定的离线基线相结合时，代理评估最为强大。要了解您的代理是否真正随着时间的推移而改进，您需要一个固定的基准以及不断变化的现实世界流量。将评估基线的测试用例作为 Amazon Bedrock AgentCore 中的数据集进行管理，带来了版本化测试装置的规范 [...]

2026年5月28日 17:51

Claude Opus 4.8 现已在 AWS 上推出

Claude Opus 4.8 is now available on AWS

本文介绍了 Opus 4.8 的改进以及为 AI 工程师将模型集成到 Amazon Bedrock 上的代理系统和生产推理工作负载中的实用指南。

2026年5月28日 16:41

使用 Amazon Quick 和 Snowflake Cortex AI 自动进行 AML 警报分类

Automate AML alert triage with Amazon Quick and Snowflake Cortex AI

这篇文章展示了通过自动化金融服务中劳动最密集的工作流程之一来实现集成：反洗钱 (AML) 警报分类。您将使用 Amazon Quick Flows 和 Snowflake Cortex 构建分类工作流程，并通过 Amazon Quick Model Context Protocol (MCP) 集成进行连接。在我们的测试环境中，使用 Amazon Quick 构建的自动化工作流程将警报调查时间从 30-90 分钟减少到 5 分钟以下。实际结果可能会因警报复杂性和数据量而异。

2026年5月27日 20:06

使用 Amazon Bedrock AgentCore 构建 AI 代理以提供业务支持

Building AI agents for business support using Amazon Bedrock AgentCore

在这篇文章中，我们将分享 AWS 生成式 AI 创新中心 (GenAIIC) 如何与 Works Human Intelligence (WHI) 合作使用 Amazon Bedrock AgentCore 构建两个 AI 代理。我们讨论了遇到的挑战以及在提高运营效率的同时降低成本高达 97% 的解决方案。

2026年5月27日 20:01

从数据过载到可行的见解：Verizon Connect 如何将代理 AI 扩展到 100,000 名用户

From data overload to actionable insights: How Verizon Connect scaled agentic AI to 100,000 users

在这篇文章中，我们向您展示 Verizon Connect 如何构建和扩展代理 AI 解决方案，将大量的车队数据转化为每天为 100,000 位用户提供清晰、可操作的见解。我们将引导您完成架构决策、实施挑战和可衡量的结果，以指导您自己的数据到见解的转换。

2026年5月26日 17:57

技术深入探讨：AgentCore 支付和代理商务创新

Technical deep dive: AgentCore payments and innovation in agentic commerce

Amazon Bedrock AgentCore 支付现已推出预览版，它提供对付费外部服务的即时付款，无需为每个提供商进行手动计费设置，稳定币支持具有成本效益的微交易，使低于美分的交易在经济上可行，并且可配置的支出护栏使您可以对代理预算和交易限制进行细粒度控制。在这篇文章中，我们将带您深入了解 AgentCore 支付的技术。

2026年5月26日 17:41

使用 Amazon Bedrock AgentCore 在 AWS 中构建高度可扩展的无服务器 LangGraph 多代理系统

Build highly scalable serverless LangGraph multi-agent systems in AWS with Amazon Bedrock AgentCore

在这篇文章中，我们提供了一种解决方案，可使用 LangGraph Agents 作为与 Amazon Bedrock AgentCore Memory 和 Amazon Bedrock AgentCore Observability 集成的编排器，在 AWS 上构建高度可扩展的无服务器多代理生成式 AI 系统。

2026年5月26日 17:39

使用 Strands Agents、NVIDIA NIM 和 Amazon Bedrock AgentCore 构建高性能生成式 AI 系统

Build high-performance generative AI systems with Strands Agents, NVIDIA NIM, and Amazon Bedrock AgentCore

在这篇文章中，您将学习如何构建一个多代理活动审核系统，该系统使用集成架构（结合了 NVIDIA NIM 进行 GPU 加速推理）来演示并行推理、上下文持久性和可追踪执行路径。 Amazon Bedrock AgentCore 提供托管运行时、共享内存和内置可观察性，Strands Agents 提供无服务器多代理编排。此方法支持生产环境中的性能、可扩展性和操作洞察力。虽然该示例侧重于营销内容审核，但相同的模式也适用于数字助理、审核自动化和检索增强生成管道。

2026年5月26日 17:22

AgentWatch：使用环境代理进行主动 AWS 监控

AgentWatch: Proactive AWS monitoring with ambient agents

在这篇文章中，我们通过实际实施展示了 AgentWatch 的功能。您将看到该解决方案如何每 15 分钟执行一次基础设施检查，总结多个 AWS 账户的 CloudWatch 指标、日志和警报。该代理直接向 Slack 提供可操作的报告，并响应有关基础设施状态的自然语言查询。在整个过程中，我们探索了三种人机交互模式，在最大限度地提高自动化的同时保持适当的监督。

2026年5月26日 16:28

从创意到 AI 应用：使用 Strands 创建智能研究助理

From idea to AI app: Creating intelligent research assistants with Strands

构建人工智能应用程序不需要机器学习 (ML) 博士学位，也不需要花费数月时间研究复杂的架构。然而，当您尝试编排多个 API 调用、管理对话状态并创建可以自行推理的代理时，就会发生这种情况。我已经看到简单的人工智能想法迅速发展成需要[...]

2026年5月26日 16:09

为 Amazon Quick 构建企业可观测性解决方案

Build an enterprise observability solution for Amazon Quick

当成百上千的用户加入企业人工智能平台时，业务领导者和平台所有者需要了解谁在使用该平台、用户对他们收到的答案是否满意以及哪些功能推动了最大程度的参与。如果没有集中的可观测性解决方案，这些数据就会分散在多个 AWS [...]

2026年5月21日 22:22

Amazon Nova Act 现已符合 HIPAA 要求

Amazon Nova Act is now HIPAA eligible

在这篇文章中，您将了解 Nova Act 提供的内容、HIPAA 资格如何适用于代理 AI 以及如何开始。

2026年5月21日 16:08

使用 Amazon Bedrock AgentCore 打破上下文窗口障碍

Break the context window barrier with Amazon Bedrock AgentCore

在本文中，您将了解如何使用 Amazon Bedrock AgentCore Code Interpreter 和 Strands Agents SDK 实施递归语言模型 (RLM)。最后，您将了解如何在上下文大小没有上限的情况下处理不同长度的文档，使用 Bedrock AgentCore Code Interpreter 作为迭代文档分析的持久工作内存，以及在沙盒 Python 环境中编排次大语言模型 (sub-LLM) 调用来分析特定文档部分。