摘要 - 在这项工作中,我们检查了不对称的沙普利谷(ASV),这是流行的Shap添加剂局部解释方法的变体。ASV提出了一种改善模型解释的方法,该解释结合了变量之间已知的因果关系,并且也被视为测试模型预测中不公平歧视的一种方法。在以前的文献中未探索,沙普利值中的放松对称性可能会对模型解释产生反直觉的后果。为了更好地理解该方法,我们首先展示了局部贡献如何与降低方差的全局贡献相对应。使用方差,我们演示了多种情况,其中ASV产生了违反直觉归因,可以说为根本原因分析产生错误的结果。第二,我们将广义添加剂模型(GAM)识别为ASV表现出理想属性的限制类。我们通过证明有关该方法的多个理论结果来支持我们的学位。最后,我们证明了在多个现实世界数据集上使用不对称归因,并使用有限的模型家族进行了使用梯度增强和深度学习模型的结果进行比较。索引术语 - 解释性,摇摆,因果关系
2 鉴于数据集的不平衡,使用精确度-召回率曲线下面积 (PRAUC) 作为准确度指标 [21]。3 首先,排除观察次数少于 10 次的参与者,以便在 5 倍交叉验证方案中每倍至少有 2 次观察。其次,如果用户的观察结果只对应于一个结果(即,他们总是做这项练习或从不做这项练习),他们也会被排除,因为如果没有两个类别,则多个模型是未定义的。排除后会剩下一组 26 位用户,称为热启动队列。4 使用 5 个外倍,并报告保留倍的平均准确度。对于组倍,超参数在 5 个内倍上进行优化。但是,由于每个参与者可用的数据量很少,因此不会在个体级别模型上执行超参数调整。在这两个层面上,折叠都是随时间随机化的,这样可以减轻由季节影响(例如假期开始)引起的任何偏差。
术后谵妄(POD)是老年髋部骨折患者常见且严重的并发症。识别出POD的高危患者有助于改善髋部骨折患者的预后。我们对2014年1月至2019年8月期间接受骨科手术治疗髋部骨折的老年患者(≥65岁)进行了回顾性研究。采用常规逻辑回归和五种机器学习算法建立POD的预测模型。采用逻辑回归方法构建POD预测列线图。计算受试者工作特征曲线下面积(AUC-ROC)、准确度、灵敏度和精确度来评估不同的模型。使用Shapley加性解释(SHAP)解释个体的特征重要性。约797名患者参加了该研究,POD的发生率为9.28%(74/797)。年龄、肾功能不全、慢性阻塞性肺病 (COPD)、抗精神病药物的使用、乳酸脱氢酶 (LDH) 和 C 反应蛋白用于构建 POD 的列线图,AUC 为 0.71。五种机器学习模型的 AUC 分别为 0.81(随机森林)、0.80(GBM)、0.68(AdaBoost)、0.77(XGBoost)和 0.70(SVM)。六种模型的敏感度范围从 68.8%(逻辑回归和 SVM)到 91.9%(随机森林)。六种机器学习模型的精确度范围从 18.3%(逻辑回归)到 67.8%(SVM)。使用逻辑回归和五种机器学习算法构建了髋部骨折患者 POD 的六种预测模型。机器学习算法的应用可以提供便捷的 POD 风险分层,使老年髋部骨折患者受益。
摘要 — 虽然可解释人工智能 (XAI) 的应用领域日益广泛,但很少有应用使深度强化学习 (RL) 更易于理解。随着 RL 变得无处不在并用于关键和一般公共应用,开发使其更易于理解和解释的方法至关重要。本研究提出了一种使用 Shapley 值解释多智能体 RL 中合作策略的新方法,Shapley 值是 XAI 中使用的博弈论概念,成功解释了机器学习算法决策背后的原理。通过在两个以合作为中心的社会挑战多智能体环境中测试该技术的常见假设,本文认为 Shapley 值是评估合作多智能体 RL 环境中玩家贡献的一种恰当方法。为了减轻此方法的高开销,使用蒙特卡洛抽样来近似 Shapley 值。多智能体粒子和顺序社交困境的实验结果表明,Shapley 值能够成功估计每个智能体的贡献。这些结果可能具有超越经济学博弈的意义(例如,对于非歧视性决策、道德和负责任的 AI 决策或公平约束下的政策制定)。它们还揭示了 Shapley 值如何仅对模型提供一般性解释,而无法解释单次运行、情节,也无法证明智能体采取的精确行动。未来的工作应侧重于解决这些关键方面。
在定向能量沉积 (DED) 中,局部材料微观结构和抗拉强度由零件上每个空间位置经历的热历史决定。虽然先前的研究已经调查了热历史对机械性能的影响,但仍然需要一种物理上可解释、简约且具有良好预测精度的抗拉强度预测模型。本文研究了一种基于 Shapley 加性解释 (SHAP) 模型解释的数据驱动预测模型来解决这一问题。首先,将从先前的实验工作中翻译出来的物理上有意义的热特征用作神经网络的输入,以进行抗拉性能预测。然后计算各个输入特征的 SHAP 值,以量化它们各自对抗拉性能预测的影响,并使用累积相对方差 (CRV) 度量降低模型复杂性。对实验获得的 Inconel 718 (IN718) 抗拉强度的预测表明,通过开发的方法量化的特征影响可以通过先前研究的结果来验证,从而证实了神经网络预测逻辑的物理可解释性。此外,基于CRV的模型复杂度降低表明,简约模型只需要不到10%的原始特征即可达到与先前文献报道相同的拉伸强度预测精度,从而证明了基于SHAP的特征降低方法在改进DED过程表征方面的有效性。
摘要:背景:创建模型来区分自我报告的心理工作量感知具有挑战性,需要机器学习来识别脑电图信号中的特征。脑电图频带比率量化了人类活动,但对心理工作量评估的研究有限。本研究评估了使用 theta-to-alpha 和 alpha-to-theta 脑电图频带比率特征来区分人类自我报告的心理工作量感知。方法:在本研究中,分析了 48 名参与者在休息和任务密集型活动时的脑电图数据。使用不同的脑电图通道簇和频带比率开发了多个心理工作量指标。使用 ANOVA 的 F 分数和 PowerSHAP 提取统计特征。同时,使用逻辑回归、梯度提升和随机森林等技术建立和测试模型。然后用 Shapley 加法解释来解释这些模型。结果:根据结果,使用 PowerSHAP 选择特征可以提高模型性能,在三个心理工作量指数中表现出超过 90% 的准确率。相比之下,用于模型构建的统计技术表明所有心理工作量指数的结果都较差。此外,使用 Shapley 值来评估特征对模型输出的贡献,可以注意到,ANOVA F 分数和 PowerSHAP 测量中重要性较低的特征在确定模型输出方面发挥了最重要的作用。结论:使用具有 Shapley 值的模型可以降低数据复杂性并改进对感知人类心理工作量的更好判别模型的训练。但是,由于选择过程中特征的重要性及其对模型输出的实际影响有所不同,因此结果有时可能不明确。
lundberg&Lee(2017)提出了一种统一的方法,以应用局部解释性(单个样本中单个变量的可变分配)和全局解释性(整个模型的可变概述),通过应用Shapley(1953)提出的游戏理论的收益原理的公平分布,通过应用收益原理的公平分布。现在称为Shap(Shapley添加说明),该建议的框架解释了ML模型的预测,其中输入变量代替了玩家,并且使用Shapley值来衡量它们对特定预测的贡献。连续地,Redell(2019)提出了一个度量标准,该指标将Shapley值的添加特性与Gelman(2018)的R平方(R2)的鲁棒性相结合,以产生一个方差分解,以准确地将每个变量对模型的探索功率的贡献进行贡献。我们还使用签名的R2,以表示与线性SEM一致的连接的调节,因为DAG中的边缘表示节点调节(如果阳性;如果抑制,如果为阴性)。使用符号(beta)(即,来自输入节点上的输出节点的线性模型(LM)拟合的系数估计值)的符号已被重新覆盖。此外,为了确定节点调节相对于DAG的局部意义,可以通过将其输入节点的ShapleyR2求和来计算每个结果节点的R-squared值的塑形分解(r = 1,...,...,r)。因此,该函数使用进度条来检查每个观察值的内核形状评估的进度。最后,应该注意的是,计算内核形状值所需的操作本质上是耗时的,计算时间与预测变量数量和观测值的数量成正比。
说明可解释性方法分析任何机器学习模型的行为和预测。实施的方法是:Fisher等人描述的特征重要性。(2018),累积的局部效应图,由Apley(2018),弗里德曼(Friedman(2001) (2013),Ribeiro等人描述的本地模型(“石灰”的变体)。 al(2016),STRUMBELJ ET所描述的Shapley值。 al(2014),Friedman等人描述的特征交互。 al 和树替代模型。(2013),Ribeiro等人描述的本地模型(“石灰”的变体)。al(2016),STRUMBELJ ET所描述的Shapley值。al(2014),Friedman等人描述的特征交互。al 和树替代模型。
Theory part Module 1 - cost models and cost accounting Cost concepts • Fixed versus variable costs • Direct and indirect costs • Marginal costs Cost estimation techniques • Work breakdown structure • Cost and revenue classification • Cost estimation techniques: indexes, unit and factor techniques • Parametric cost estimating: power-sizing (economies of scale), learning curve Cost accounting versus financial accounting • Management and cost accounting • Standard costing (costs of goods sold, COGS)•基于活动的成本成本•边际成本(成本量 - 企业关系关系)•中断和盈利能力分析成本分配技术•成本分配的目的•逐步,独立和完全分配的成本和完全分配的成本•SHAPLEY价值•Shapley价值•Shapley价值•成本分配•基于销售的速度和基于销售的率•投资率2 - 投资分析•投资分析时间•有效分析时间•有效分析时间,有效性分析时间,有效性分析时间•单个项目的方法•最低吸引力的回报率(MARR)•目前的价值,未来价值,年度价值方法•内部回报率•投资期投资评估方法多种替代方案•研究期和有用的寿命和有用的寿命•替代方案之间的比较和选择•比较相互排斥的替代方案3 - 相互排斥3 - 高级替换分析•经过折扣•重复分析•及时的分析•及时的分析•及时的分析•及时的型号•及时的分析•及时的分析•不确定性下的替换分析投资分析•屈服和灵敏度分析•决策逆转•方案分析
摘要 - 在Point-Cloud获取环境中的常见挑战,例如实现安全性和自动驾驶,是确定传感器和工人的放置以及要支付给他们的奖励。游戏理论可作为一种非常强大的工具,用于确定部署的传感器和工人的适当奖励的问题,并且先前的一些研究提出了使用游戏理论来确定奖励的方法。但是,这些方法并未考虑AI对下游任务的识别准确性的影响,以开发这些适当的奖励。在本文中,我们通过考虑AI的识别准确性提出了游戏理论的新特征功能。为了定义我们的功能,我们研究了观点数量和点云的噪声水平如何影响分类精度。此外,我们分析了识别模型通过使用Shap重点关注的点云的哪一部分,这是一种基于Shapley值改善机器学习的方法。索引术语 - 点云,特征功能,莎普利值,shap,零拍点云识别模型