人工智能与数据、计算能力和新算法的结合可以为解决工程问题(例如机床状态监测)提供重要工具。然而,这些问题中的许多问题都需要能够在高度动态的场景中执行的算法,在这些场景中,数据流具有来自不同类型变量的极高采样率。基于高斯混合模型的无监督学习算法(称为基于高斯的动态概率聚类 (GDPC))就是其中一种工具。然而,如果数据流中发生大量与瞬态相关的概念漂移,则该算法可能存在重大限制。在这些条件下,GDPC 变得不稳定,因此我们提出了一种称为 GDPC+ 的新算法来提高其稳健性。GDPC+ 代表了一项重要的改进,因为我们引入了:(a) 基于贝叶斯信息准则 (BIC) 自动选择混合成分的数量,以及 (b) 基于柯西-施瓦茨散度与迪基-富勒检验相结合的概念漂移过渡稳定。因此,就误报数量而言,GDPC+ 在高度动态场景中的表现优于 GDPC。使用随机合成数据流和从高速生产发动机曲轴的机床获得的真实数据流状态监测研究了 GDPC+ 的行为。我们发现初始时间窗口大小可用于使算法适应不同的分析要求。还通过归纳由重复增量修剪以产生误差减少 (RIPPER) 算法生成的规则来研究聚类结果,以便从底层监控过程及其相关概念漂移中提供见解。
主要关键词