ShaTS 简介:基于 Shapley 的时间序列模型方法

为什么你不应该用表格 Shapley 方法解释你的时间序列数据ShaTS 简介:基于 Shapley 的时间序列模型方法一文首先出现在《走向数据科学》上。

来源:走向数据科学

简介

是解释机器学习 (ML) 和深度学习 (DL) 模型的最流行工具之一。然而,对于时间序列数据,这些方法通常存在不足,因为它们没有考虑此类数据集中固有的时间依赖性。在最近的一篇文章中,我们(Ángel Luis Perales Gómez、Lorenzo Fernández Maimó 和我)介绍了 ShaTS,这是一种专门为时间序列模型设计的基于 Shapley 的新型可解释性方法。 ShaTS 通过结合提高计算效率和可解释性的分组策略来解决传统 Shapley 方法的局限性。

安赫尔·路易斯·佩拉莱斯·戈麦斯 洛伦佐·费尔南德斯·麦莫 ShaTS

Shapley 价值观:基础

Shapley 值起源于合作博弈论,并根据参与者对协作努力的个人贡献公平地分配参与者的总收益。玩家的沙普利值是通过考虑所有可能的玩家联盟并确定该玩家对每个联盟的边际贡献来计算的。

沙普利值

形式上,玩家 i 的 Shapley 值 φi 为:

φi

\[ \varphi_i(v) = \sum_{S \subseteq N \setminus {i}}\frac{|S|! (|N| – |S| – 1)!}{|N|!} (v(S \cup {i}) – v(S)) \]

其中:

    N 是所有玩家的集合。S 是不包括 i 的玩家联盟。v(S) 是为每个联盟分配一个值的价值函数(即联盟 S 可以获得的总增益)。
  • N 是所有玩家的集合。
  • N
  • S 是不包括 i 的玩家联盟。
  • 小号
  • v(S) 是为每个联盟分配一个值的价值函数(即联盟 S 可以实现的总增益)。
  • v(S)

    该公式对玩家 i 在所有可能的联盟中的边际贡献进行平均,并按每个联盟形成的可能性进行加权。

    从博弈论到 xAI:机器学习中的 Shapley 值

    SHAP 库
    将 SHAP 集成到工业异常检测场景中。作者创建的图像

    这种方法有两个主要缺点:

    计算复杂性 p G = {G1, … , Gp} 1 GI G T j