详细内容或原文请订阅后点击阅览
从反应性到预测性:通过机器学习和INT
在机器学习发生之前,了解机器学习如何预测网络拥塞,从反应性到预测性:通过机器学习和INT首先出现在数据科学方面的预测网络拥塞。
来源:走向数据科学上下文
中心,网络放缓可能无处不在。分布式系统,微服务或AI培训工作的突然流量会在几秒钟内压倒开关缓冲区。问题不仅仅是知道什么时候出了问题。它能够在发生之前就可以看到它。TelemetrySystems被广泛用于监视网络健康,但大多数以反应性模式运行。他们只有在表现退化后才宣传拥塞。一旦链接饱和或队列已满,您就已经超过了早期诊断的点,并且追踪原始原因变得更加困难。
频段网络遥测(INT)试图通过在通过网络传播时用元数据标记实时数据包来解决该差距。它为您提供了实时的视图,可以了解交通流,排队的构建,延迟蔓延的位置以及每个开关如何处理转发的方式。仔细使用时,这是一个强大的工具。但这是一笔成本。在每个数据包上启用INT可以将严重的开销引入严重的开销,并将大量的遥测数据推向控制平面,您甚至可能不需要其中的大部分。
如果我们可以更具选择性怎么办?我们没有跟踪所有内容,而是预测,麻烦可能仅为这些地区而形成INT并启用INT。这样,当它最重要的情况下,我们就会获得详细的可见性,而无需支付始终对监视的全部费用。
始终对遥测的问题
int为您提供了网络内部发生的事情的强大,详细的视图。您可以直接从数据包路径中跟踪队列长度,逐跳延迟和时间戳。但是有一个成本:此遥测数据增加了每个数据包的重量,如果您将其应用于所有流量,它可以吞噬大量的带宽和处理能力。要解决这个问题,许多系统都需要快捷方式:
采样:仅标记带有遥测数据的数据包的分数(例如 - 1%)。
采样: 事件触发的遥测: