许多无监督的异常检测算法依赖于最近的邻居的概念来计算异常得分。这种算法很受欢迎,因为对数据没有任何假设,这使它们成为非结构化数据集的强大选择。然而,严重影响模型性能的最近邻居的数字(k)不能在无监督的设置中调整。因此,我们提出了新的和无参数的分析隔离和基于距离的异常(AIDA)检测al-gorithm,将距离的指标与隔离相结合。基于AIDA,我们还介绍了基于钢化的隔离解释(TIX)算法,该算法确定了最相关的特征,即使在大型多维数据集中,也可以提高离群值,从而提高了检测机制的整体解释性。AIDA和TIX都经过了彻底的测试,并将其与最先进的替代方案进行了比较,事实证明是对异常检测中现有工具集的有用补充。
主要关键词