1 简介 机器学习 (ML) 模型广泛应用于许多实际应用的决策过程。现代 ML 方法的快速发展、实际成就和整体成功 [LeCun et al. , 2015; Jordan and Mitchell, 2015; Mnih et al. , 2015; ACM, 2018] 保证了机器学习将作为一种通用计算范式盛行,并将找到越来越多的实际应用,其中许多与我们生活的各个方面有关。不幸的是,ML 模型有时会灾难性地失败 [Zhou and Sun, 2019; CACM Letters to the Editor, 2019]。它们还可能由于模型中的偏见(例如种族、性别、年龄)而支持糟糕的决策 [Angwin et al. , 2016]。由于脆弱性,它们的决策可能会令人困惑 [Szegedy et al. , 2017]。 ,2014;Goodfellow 等人,2015]。因此,迫切需要了解 ML 模型的行为,分析模型(或用于训练模型的数据)的(潜在)故障,对其进行调试并可能进行修复。这引起了人们对验证 ML 模型操作的兴趣日益浓厚 [Ruan 等人,2018;Narodytska,2018;Narodytska 等人,2018b;Katz 等人,2017],同时也激发了旨在设计可解释人工智能(XAI)方法的努力 [Ribeiro 等人,2018;Lundberg 和 Lee,2017;Ignatiev 等人,2018;Narodytska 等人,2018a;Ribeiro 等人, 2016;伊格纳季耶夫等人。 , 2019a;
主要关键词