自我修复数据中心:AI如何转换IT操作

“如果您每天只能在30分钟后给我的运营团队,那将是一场胜利。”一个CIO的谦虚请求反映了当今IT运营团队的现实,即以烟气运行的反应性消防模式。但是,这是凌晨3点的警报风暴和定义传统IT操作的抢劫时刻正在变得过时。自我修复[…]自我修复数据中心:AI如何转换IT操作的方式首先出现在Unite.AI上。

来源:Unite.AI

“如果您每天只能在30分钟后给我的运营团队,那将是一场胜利。”一个CIO的谦虚请求反映了当今IT运营团队的现实,即以烟气运行的反应性消防模式。但是,这是凌晨3点的警报风暴和定义传统IT操作的抢劫时刻正在变得过时。

自我修复数据中心(似乎是未来派)正在通过代理AI系统出现,这些系统在人类操作员收到第一个警报之前检测,诊断和解决问题。这不是理论上的;现在正在发生,从根本上改变了企业基础架构管理并重新定义了IT运营团队的作用。

代理AI

IT环境已经超过了人类可以自行监控和管理的东西。组织涉及复杂的混合基础架构,这些基础架构涵盖了传统系统,私有云,多个公共云提供商和边缘计算环境。出现问题时,他们会级联。一个较小的数据库放缓触发了应用超时,导致了重试的风暴和广泛的服务退化。为昨天更简单的体系结构设计的传统工具无法保持步伐 - 它们在孤岛中运行,缺乏跨平台的可见性,并产生数千个断开连接的警报,这些警报甚至是最有经验的运营团队。

这种复杂性为AI提供了前所未有的价值的机会。 AI精确地在人类挣扎的地方表现出色 - 管理系统生成的问题与确定性结果。系统故障并不明确。他们遵循模式 - patterns AI可以在不干预的情况下识别,分析并最终解决。代理AI系统通过压缩多达95%的警报,同时主动检测和解决问题,然后在他们升级到服务中断之前,通过压缩95%的警报来证明这种功能。

95%的警报

超越警报分类:自我修复实际上是如何工作

AI驱动的弹性的三个支柱

弥合技能差距和提升团队