可观察性领域信息情报检索---XiaoMi-AI

DataRobot博客

2026年3月2日 17:45

自我管理的可观察性：在您的边界内运行代理 AI

Self-managed observability: Running agentic AI inside your boundary

当人工智能系统在生产中表现不可预测时，问题很少出现在单个模型端点上。出现延迟峰值或失败请求的情况通常可以追溯到重试循环、不稳定的集成、令牌过期、编排错误或跨多个服务的基础设施压力。在分布式、代理架构中，症状出现在边缘，而根本原因......自我管理的可观察性：在边界内运行代理人工智能一文首先出现在 DataRobot 上。

DataRobot博客

2026年2月11日 23:40

代理人工智能可观察性：可信企业人工智能的基础

Agentic AI Observability: The Foundation of Trusted Enterprise AI

您的代理 AI 系统每小时会做出数千个决策。但你能证明他们为什么做出这些选择吗？如果答案缺乏有记录的、可重复的解释，那么你就没有在尝试人工智能。相反，您在生产中运行不受监控的自主权。在代理批准交易、控制工作流程和交互的企业环境中......代理人工智能可观察性：可信企业人工智能的基础首先出现在 DataRobot 上。

亚马逊云科技 _机器学习

2026年2月24日 15:46

在 Amazon SageMaker 训练作业上使用 veRL 和 Ray 训练 CodeFu-7B

Train CodeFu-7B with veRL and Ray on Amazon SageMaker Training jobs

在这篇文章中，我们将演示如何在由 SageMaker 训练作业管理的分布式 Ray 集群中使用组相对策略优化 (GRPO) 和 veRL 来训练 CodeFu-7B（一种用于竞争性编程的专用 70 亿参数模型），veRL 是一个灵活高效的大型语言模型 (LLM) 训练库，可直接扩展各种 RL 算法，并与现有 LLM 基础设施无缝集成。我们将介绍完整的实施过程，涵盖数据准备、分布式训练设置和全面的可观察性，展示这种统一的方法如何为复杂的 RL 训练工作负载提供计算规模和开发人员体验。

亚马逊云科技 _机器学习

2026年2月20日 20:26

Amazon SageMaker AI 2025 年回顾，第 2 部分：提高 SageMaker AI 模型自定义和托管的可观测性并增强功能

Amazon SageMaker AI in 2025, a year in review part 2: Improved observability and enhanced features for SageMaker AI model customization and hosting

2025 年，Amazon SageMaker AI 进行了多项改进，旨在帮助您训练、调整和托管生成型 AI 工作负载。在本系列的第 1 部分中，我们讨论了灵活的培训计划和对推理组件的性价比改进。在这篇文章中，我们讨论可观察性、模型定制和模型托管方面的增强功能。这些改进有助于在 SageMaker AI 上托管全新类别的客户用例。

可观察性关键词检索结果

自我管理的可观察性：在您的边界内运行代理 AI

代理人工智能可观察性：可信企业人工智能的基础

在 Amazon SageMaker 训练作业上使用 veRL 和 Ray 训练 CodeFu-7B

Amazon SageMaker AI 2025 年回顾，第 2 部分：提高 SageMaker AI 模型自定义和托管的可观测性并增强功能