可解释的用规则fit检测:直观指南

创建可解释的规则,以表征已确定的异常情况下可解释的异常检测:直观指南首先出现在数据科学方面。

来源:走向数据科学

您的异常检测结果给利益相关者,下一个问题总是“为什么?”。

为什么

实际上,简单地标记异常很少。了解出了什么问题对于确定最佳下一个动作至关重要。

简单地标记异常很少。了解出了什么问题是Cr 出了什么问题

然而,大多数基于机器学习的异常检测方法停止产生异常得分。它们本质上是黑盒子,这使得能够理解其产出很痛苦 - 为什么该样本的异常得分高于其邻居?

为了应对这一可解释性挑战,您可能已经诉诸了流行的可解释的AI(XAI)技术。也许您正在计算特征的重要性,以确定哪些变量正在驱动异常,或者您正在进行反事实分析以查看案例与正常情况有多近。

x ai

这些很有用,但是如果您可以做更多的事情怎么办?如果您可以得出一组可解释的如果当时的规则来表征已确定的异常情况,该怎么办?

如果 - 然后是规则

这正是规则Fit算法[1]所承诺的。

Rulefit

在这篇文章中,我们将探讨规则Fit算法如何直观地工作,如何应用它来解释检测到的异常,并浏览具体的案例研究。

1。它如何工作?

在探讨技术细节之前,首先澄清应用算法后的目标:我们希望有一组IF-then规则,这些规则定量地表征了异常样本,以及这些规则的重要性。

重要性

要到达那里,我们需要回答两个问题:

(1)如果数据从数据中产生有意义的条件?

(2)我们如何计算规则重要性得分以确定哪些实际重要?

规则Fit算法通过将工作分为两个互补部分,即“规则”和“ fit”来解决这些问题。

1.1 Rulefit中的“规则”

在Rulefit中,一个规则看起来像:

如果x1 <10和x2> 5,则1 else 0

如果 然后 else 拉索