可观察性关键词检索结果

自我管理的可观察性:在您的边界内运行代理 AI

Self-managed observability: Running agentic AI inside your boundary

当人工智能系统在生产中表现不可预测时,问题很少出现在单个模型端点上。出现延迟峰值或失败请求的情况通常可以追溯到重试循环、不稳定的集成、令牌过期、编排错误或跨多个服务的基础设施压力。在分布式、代理架构中,症状出现在边缘,而根本原因......自我管理的可观察性:在边界内运行代理人工智能一文首先出现在 DataRobot 上。

代理人工智能可观察性:可信企业人工智能的基础

Agentic AI Observability: The Foundation of Trusted Enterprise AI

您的代理 AI 系统每小时会做出数千个决策。但你能证明他们为什么做出这些选择吗?如果答案缺乏有记录的、可重复的解释,那么你就没有在尝试人工智能。相反,您在生产中运行不受监控的自主权。在代理批准交易、控制工作流程和交互的企业环境中......代理人工智能可观察性:可信企业人工智能的基础首先出现在 DataRobot 上。

在 Amazon SageMaker 训练作业上使用 veRL 和 Ray 训练 CodeFu-7B

Train CodeFu-7B with veRL and Ray on Amazon SageMaker Training jobs

在这篇文章中,我们将演示如何在由 SageMaker 训练作业管理的分布式 Ray 集群中使用组相对策略优化 (GRPO) 和 veRL 来训练 CodeFu-7B(一种用于竞争性编程的专用 70 亿参数模型),veRL 是一个灵活高效的大型语言模型 (LLM) 训练库,可直接扩展各种 RL 算法,并与现有 LLM 基础设施无缝集成。我们将介绍完整的实施过程,涵盖数据准备、分布式训练设置和全面的可观察性,展示这种统一的方法如何为复杂的 RL 训练工作负载提供计算规模和开发人员体验。

Amazon SageMaker AI 2025 年回顾,第 2 部分:提高 SageMaker AI 模型自定义和托管的可观测性并增强功能

Amazon SageMaker AI in 2025, a year in review part 2: Improved observability and enhanced features for SageMaker AI model customization and hosting

2025 年,Amazon SageMaker AI 进行了多项改进,旨在帮助您训练、调整和托管生成型 AI 工作负载。在本系列的第 1 部分中,我们讨论了灵活的培训计划和对推理组件的性价比改进。在这篇文章中,我们讨论可观察性、模型定制和模型托管方面的增强功能。这些改进有助于在 SageMaker AI 上托管全新类别的客户用例。