解释AI的决定已成为一个重要的研究主题。使用深度学习(Krizhevsky等,2012; Lecun等,2015)在图像分类方面取得了很大进展,对解释图像分类的结果产生了重大兴趣。尽管有许多可解释的AI(XAI)的信息,但本文首先着重于学习对图像进行分类。然后,我们讨论可解释AI的更广泛的信息。最近的会议包括有关可解释AI的教程和讲习班。XAI有几项好的调查(Chakraborty等人。,2017&došilović等,2018)。这不是其中之一。取而代之的是,在与放射学和眼科专家解决问题以及鸟类识别方面的问题之后,我们得出的结论是,现有的技术留出了很大的改进空间。该领域需要其他方案和方法,包括澄清XAI的目标,尤其是在用户,专家和图像分类方面。尽管Xai的一些最初目标是“向人类用户解释他们的决策和行动”(Gunning&Aha,2018),但最新的最新目前是以开发人员为中心的,而不是以用户为中心。解释图像分类的主要方法是将重要性得分分配给图像上的显着图或区域上的像素或区域,以形象化区域的重要性(红色,橙色,黄色…)。为创建热图开发的方法包括遮挡灵敏度(Zeiler&
深度学习已成为解决众多现代问题的常见解决方案,占据了当今技术和社会关注的核心。其权力的配方是基于梯度反向传播的前所未有的大维度和学习过程的结合效应[Lecun等,1998]。,由于神经元模型的简单性,该模型被分解为加权线性总和,然后是非线性激活函数,权重梯度仅由它们各自的输入而不涉及交叉参数依赖性确定。因此,就计算过程而言,梯度反向传播是由梯度链规则自动化的,仅需要对远期输入数据进行缓冲。但是,深度学习在计算上是密集的。图1显示了其典型的操作,其中向前传球在推理和训练中都使用,而后传播仅用于训练。推断,必须存储整个模型参数,并且主要计算是张量点产品。在训练中,除推理外,向前传球还需要缓冲每一层的所有输入张量。它们用于衍生计算,基于梯度的优化器和梯度反向传播所需的张量点产品。也需要基于梯度的学习原理,模型参数和所有信号都是连续数字,通常以32位浮点格式表示。它会导致大量的内存足迹。图2显示了我们的一个示例,以说明
解释人工智能的决策已成为一个重要的研究课题。使用深度学习进行图像分类取得了长足的进步(Krizhevsky 等人,2012 年;LeCun 等人,2015 年),引起了人们对解释图像分类结果的浓厚兴趣。尽管可解释人工智能 (XAI) 有许多应用,但本文首先关注学习对图像进行分类。然后,我们讨论可解释人工智能的更广泛含义。最近的会议包括有关可解释人工智能的教程和研讨会。有几项关于 XAI 的很好的调查(Chakraborty 等人,2017 年和 Došilović 等人,2018 年)。这不是其中之一。相反,在与放射学和眼科学专家以及鸟类识别专家一起研究问题之后,我们得出结论,现有技术仍有很大改进空间。该领域需要更多的方向和方法,包括明确 XAI 的目标,特别是在用户、专家和图像分类方面。尽管 XAI 的一些最初目标是“向人类用户解释他们的决定和行动”(Gunning & Aha,2018),但目前最先进的技术是以开发人员为中心,而不是以用户为中心。解释图像分类的主要方法是为图像上叠加的显着图或热图上的像素或区域分配重要性分数,用颜色尺度(红色、橙色、黄色……)可视化区域的重要性。为创建热图而开发的方法包括遮挡灵敏度(Zeiler &
许多机器学习算法的核心是使用随机变量 (randvars) 描述隐藏在数据中的行为或结构的大型概率模型。在有效机器学习算法激增之后,有效的推理算法成为焦点,以利用学习到的模型或进一步优化机器学习算法 (LeCun 2018)。通常,模型由已知个体 (常数) 池 (即已知宇宙) 及其之间的关系形成。处理个体集可以实现易于处理的推理 (Niepert and Van den Broeck 2014)。通过与行为相同的个体代表合作并仅在必要时查看特定个体,提升可以有效地处理个体集。如果根据患病人数对可能的流行病进行建模,那么所有患病的人对流行病的行为都相同。在参数因子 (parfactors) 中,用逻辑变量 (logvars) 参数化的随机变量紧凑地表示随机变量集 (Poole 2003)。一个 parfactor 不是为每个人指定一个关于患病者如何影响流行病的因子,而是作为所有人的模板。马尔可夫逻辑网络使用一阶逻辑公式进行紧凑编码 (Richardson and Domingos 2006)。已知宇宙意味着 parfactors 或马尔可夫逻辑网络中的 logvars 具有域,并且可能具有将域限制为特定 parfactors 或公式的某些常数的约束。提升推理算法
1 简介 机器学习 (ML) 模型广泛应用于许多实际应用的决策过程。现代 ML 方法的快速发展、实际成就和整体成功 [LeCun et al. , 2015; Jordan and Mitchell, 2015; Mnih et al. , 2015; ACM, 2018] 保证了机器学习将作为一种通用计算范式盛行,并将找到越来越多的实际应用,其中许多与我们生活的各个方面有关。不幸的是,ML 模型有时会灾难性地失败 [Zhou and Sun, 2019; CACM Letters to the Editor, 2019]。它们还可能由于模型中的偏见(例如种族、性别、年龄)而支持糟糕的决策 [Angwin et al. , 2016]。由于脆弱性,它们的决策可能会令人困惑 [Szegedy et al. , 2017]。 ,2014;Goodfellow 等人,2015]。因此,迫切需要了解 ML 模型的行为,分析模型(或用于训练模型的数据)的(潜在)故障,对其进行调试并可能进行修复。这引起了人们对验证 ML 模型操作的兴趣日益浓厚 [Ruan 等人,2018;Narodytska,2018;Narodytska 等人,2018b;Katz 等人,2017],同时也激发了旨在设计可解释人工智能(XAI)方法的努力 [Ribeiro 等人,2018;Lundberg 和 Lee,2017;Ignatiev 等人,2018;Narodytska 等人,2018a;Ribeiro 等人, 2016;伊格纳季耶夫等人。 , 2019a;
AI 被定义为计算机科学的一门学科,其重点是创造能够感知世界并表现得像人类的机器 (13)。最初的 AI 算法用于简单的数据分析,由程序员硬编码,无法识别未专门编程的模式 (14)。ML 是 AI 的一个子领域,其中算法可以识别和学习复杂数据集中的模式以产生智力预测,而不是通过显式编程 (14,15)。然而,大多数传统的 ML 算法仍然需要人工输入,并且此类算法能够评估的模式仍然相当简单。DL 可以被概念化为 ML 的一类,其中算法基于人工神经网络组织成许多处理层,类似于人脑。医学成像最常用的 DL 模型是卷积神经网络 (CNN) (16)(图 1),最初由 Fukushima 于 1980 年描述 (17)。LeCun 等人于 1989 年首次描述了使用反向传播训练 CNN 进行图像识别 (18)。2012 年,Krizhevsky 等人首次使用图形处理单元 (GPU) 训练 CNN 对物体进行分类,并因此赢得了 ImageNet 大规模视觉识别挑战赛 (19)。CNN 不需要人工干预即可进行复杂的数据分析 (20)。CNN 模仿人类大脑,神经元组织成多层 (21)
不同的生物过程(BPS)的破坏会对生物体产生负面影响并导致疾病状态。早期疾病在精确医学中起着重要作用,以改善临床决策。高通量方法的开发通过为每个患者(称为OMICS概况)轻松获取大量生物学信息,从而影响了精度医学。omics曲线是许多分子实体的相互作用引起的高维复杂特征。精密医学中使用的大多数机器学习方法中的第一个共同步骤是一个特征选择程序,可降低数据的大小以从单词构建分类器(Kourou等人。2015)。由于选择过程与前字典任务分离,因此仅将选定的功能用于下游预测(Liu等人。2019)。仅使用选定的功能限制了模型从省略的功能中提取隐藏信息的能力。深度学习可以从所有功能及其相互作用中提取和利用完整的信息。此特征可能对实现更好的预测性能很有用。在计算机视觉或自然语言处理中深度学习的最新成功之后(Lecun等人2015),不同的深度学习体系结构成功地应用于OMICS数据。它允许具有非线性建模的特征的高度抽象,并且可以处理复杂
深度学习(DL)通过启用由多个处理层组成的计算模型来学习数据的抽象表示,从而彻底改变了人工智能的领域(Hinton等,2006; Bengio等,2006)。传统的机器学习方法数十年来一直限制,因为需要专家知识来设计复杂的特征提取算法,这在将原始数据转换为合适的分类形式的过程中。相比之下,深层倾斜的方法作为表示学习技术,使学习模型能够直接用原始数据馈送,以发现分类所需的表示形式(Krizhevsky等,2017; Lecun等,2015)。Currently, an intensive research effort is being devoted to the development of novel neuroimaging techniques to better understand the mechanisms of the central nervous system (CNS) and to early recognize age-related neural diseases ( Payan and Montana, 2015; Sarraf and Tofighi, 2016; Martinez-Murcia et al., 2020; Martinez-Murcia et al., 2018, 2016 ) Ortiz等。。大量多中心研究提供的大量数据调查了与年龄相关的神经疾病的新生物标志物,这为开发更准确的深度学习模型提供了一个机会,以早期认识神经退行性变化以及神经疾病的渐进过程(Cole and Franke,2017; Marzban et et and e an e an Al an Al a al niz and an an an an e an e e e an and and and and and and and and and an e e e e e e e e e e e e e e e e eT an and and and and and and and and and and and and and and and and。等,2018)。
到(各个方面)输入检查的统计结构,而无需映射到目标输出(例如,发现LAN Guage的语音结构中的规律性)。这些网络非常适合发现环境中存在的统计结构,而无需建模者知道结构是什么。无监督的培训方法的一个众所周知的例子是Hebb(1949)提出的学习规则:加强同时活动的单元之间的连接,如果只有一个单位活跃,则可以削弱两个单元之间的连接。尽管人工神经网络和生物神经网络之间存在表面的相似性(即,在神经元之间传递的互连性和刺激以确定它们的激活,并通过适应连接强度来学习),但这些认知模型通常并非声称在生物神经元的水平上模拟处理。相反,神经网络模型在Marr(1982)的算法级别上形成了描述,也就是说,它们指定了认知表示和操作,同时忽略了生物学实现。神经网络在1990年代经历了流行的激增,但是从21世纪初开始,它们被象征性的概率mod Els所掩盖。然而,神经网络享受了最近的复兴部分,部分原因是深度学习模型的成功,这些模型在各种人工智能任务上表现出最先进的表现(Lecun,Bengio,&Hinton,2015年)。在大多数情况下,认知建模领域仍然赶上这些新颖的发展。我们在第5节中返回此问题。因此,目前最具影响力的连接主义认知模型是更传统的变化。
2019 年 9 月,Google Scholar 上查找到 Yoshua Bengio 撰写的科学出版物被引用近 206,000 次,H 指数为 146,仅 2018 年就被引用了 60,000 多次。正如图灵奖特别认可的那样,他的主要贡献共同创造了深度学习领域,涉及循环网络、使深度学习成功的方法、深度学习的理论理解、基于注意力的新架构的开发以及使神经网络能够处理集合而不仅仅是向量和序列,以及开发深度生成模型(如生成对抗网络)。最近,YB 将注意力转向了表示学习的代理视角(以及深度强化学习),并参加了关于人工智能社会责任发展的国内和全球讨论(和文件),并为人工智能在社会公益应用方面的研究做出了贡献,例如在医疗保健、环境和教育领域。主要贡献如下。 • 1989-1998 卷积和循环网络与概率对齐 (HMM) 相结合来对序列进行建模,这是我的博士论文 (1991)、NIPS'1988、NIPS'1989、Eurospeech'1991、PAMI'1991、IEEE Trans. Neural Nets 1992 的主要贡献。这些架构首先应用于我博士论文中的语音识别(并在 2010 年后重新发现),然后与 Yann LeCun 等人一起应用于手写识别和文档分析(被引用最多的论文是“基于梯度的学习应用于文档识别”,1998 年,引用次数超过 19,000 次)。 • 1991-1995 与 Samy Bengio 一起学习学习论文,从 1991 年的 IJCNN 开始,
