摘要。可解释人工智能 (XAI) 正在迅速成为一个新兴且快速增长的研究领域;然而,尽管 XAI 可以为人工智能在该行业的应用带来潜力,但它在医疗保健领域的应用仍处于早期阶段。仍有许多挑战有待解决,包括制定解释标准、不同利益相关者与模型之间的互动程度、质量和性能指标的实施、安全和问责标准的一致意见、将其集成到临床工作流程和 IT 基础设施中。本文有两个目标。第一个是介绍文献调查的总结结果,并强调可解释性的最新进展,包括 XAI 在医疗保健行业的差距、挑战和机遇。为了更容易理解和加入这个研究领域,我们建议采用综合分类法对可解释性方法进行分类。第二个目标是问一个问题,即通过特定的问题/领域视角,应用一种新的方式来看待可解释性问题空间,并以与 AutoML 类似的方式自动化该方法,是否有助于缓解上述挑战。在文献中,人们倾向于从模型优先的角度来看待人工智能的可解释性,这将具体的问题和领域放在一边。例如,患者生存模型的可解释性与解释医院费用程序计算相同。有了明确确定的 XAI 应该应用的问题/领域,范围就很明确,使我们能够(半)自动地找到合适的模型,优化它们的参数及其解释、指标、利益相关者、安全/问责水平,并提出将它们整合到临床工作流程中的方法。
邀请在2024年12月AI的全球问题上关于AI的全球问题的神经访问研讨会2024年12月在2024年12月的开放问题,2024年10月CIFAR DEEP LEAD LEAVY SUMMLE暑期夏季学校2024年7月,多伦多大学学生AI学生AI大学学生AI 2023年1月2023年1月1月1月的剑桥大学cambridge University computational and Biological Lab Scienter 2022年多伦多大学学校(高中)研究俱乐部(远程)2022年4月神经研讨会:编程语言和神经成像系统(遥远)2021年12月Schwartz-riesman Institute Institute研讨会系列(远程)2021年11月)ICCV ICCV ICCV关于Neural Architect on Neural Architect:现在和未来的(远程(遥远)2021年10月20日至2021年10月20日Keynote:K. ICML Workshop on Time Series (remote) July 2021 Oxford University, StatML Centre for Doctoral Training Seminar (remote) July 2021 Centre for Mathematics and Algorithms for Data, University of Bath (remote) July 2021 Microsoft Research AutoML Lecture Series (remote) May 2021 Flatiron Institute, Center for Computational Mathematics May 2021 ICLR Workshop on Deep Learning for Simulation (remote) April 2021 University College伦敦,DeepMind/Ellis CSML研讨会系列(遥控)2021年2月,贝叶斯深度学习(远程)Neurips Europe Meetup 2020年12月Neurips研讨会:超越反射(远程)2020年12月
IBS 不被认为是一种器质性疾病,通常在下消化道内镜检查中没有异常,尽管最近有报道称 IBS 患者出现生物膜形成、菌群失调和组织学微炎症。在本研究中,我们调查了人工智能 (AI) 结直肠图像模型是否可以识别与 IBS 相关的微小内镜变化,这些变化通常无法被人类调查者检测到。研究对象根据电子病历确定,分为 IBS(I 组;n = 11)、以便秘为主的 IBS(IBS-C;C 组;n = 12)和以腹泻为主的 IBS(IBS-D;D 组;n = 12)。研究对象没有其他疾病。获取了 IBS 患者和无症状健康受试者(N 组;n = 88)的结肠镜检查图像。使用Google Cloud Platform AutoML Vision(单标签分类)构建AI图像模型,计算敏感度、特异度、预测值和AUC。为N组、I组、C组和D组分别随机选择了2479、382、538和484张图像。区分N组和I组的模型的AUC为0.95。I组检测的敏感度、特异度、阳性预测值和阴性预测值分别为30.8%、97.6%、66.7%和90.2%。区分N组、C组和D组的模型的总体AUC为0.83;N组的敏感度、特异度和阳性预测值分别为87.5%、46.2%和79.9%。使用图像 AI 模型,IBS 的结肠镜检查图像可以在 AUC 0.95 处与健康受试者区分开来。需要进行前瞻性研究以进一步验证这种外部验证模型在其他机构是否具有类似的诊断能力,以及是否可以用它来确定治疗效果。
目的:本研究研究了数据仓库系统中机器学习(ML)的利用及其将在多大程度上改变商业智能和分析的程度。它旨在了解ML如何改进常规数据仓库系统以支持预测和预测。方法论:本研究使用文献综述以及案例分析。它讨论了使用数据仓库实施机器学习模型时可能出现的问题,例如与数据质量,可扩展性和实时处理有关的问题。该工作检查了诸如数据库内计算,特征存储和MLOP之类的集成模式。案例研究以证明在不同领域使用整合的价值。发现:将机器学习与DW系统相结合,在不同领域提供了显着优势。这种协同作用增强了分析能力,使组织在预测性和规范性分析中的缺点高于描述性分析。但是,这样的决定并不简单,因为它具有实现问题,例如数据质量问题,可伸缩性和实时处理问题。集成最佳实践包括数据库机器学习处理,功能商店和适当的MLOP实践。来自医疗保健行业,银行和金融服务,零售和制造行业的现实生活示例表明,这种整合为业务带来了运营增强,并对客户和整体组织绩效产生了积极影响。建议:这项工作提供了一个有用的框架,用于研究和构建ML在数据仓库中的集成,这是从理论角度到实际仓库的过渡。它为组织提供了实用建议,并强调了与业务目标,数据质量,体系结构,安全和培训的选择相关的集成策略。本研究还设想了未来的趋势,例如边缘计算,汽车和可解释的AI,并提供了有关如何利用这种技术互补性的指南。生成的见解可帮助决策者和从业者了解利用ML-DATA仓库集成作为当代商业环境中转向数据驱动方法的战略资产的可能性。
目的:本研究研究了数据仓库系统中机器学习(ML)的利用及其将在多大程度上改变商业智能和分析的程度。它旨在了解ML如何改进常规数据仓库系统以支持预测和预测。方法论:本研究使用文献综述以及案例分析。它讨论了使用数据仓库实施机器学习模型时可能出现的问题,例如与数据质量,可扩展性和实时处理有关的问题。该工作检查了诸如数据库内计算,特征存储和MLOP之类的集成模式。案例研究以证明在不同领域使用整合的价值。发现:将机器学习与DW系统相结合,在不同领域提供了显着优势。这种协同作用增强了分析能力,使组织在预测性和规范性分析中的缺点高于描述性分析。但是,这样的决定并不简单,因为它具有实现问题,例如数据质量问题,可伸缩性和实时处理问题。集成最佳实践包括数据库机器学习处理,功能商店和适当的MLOP实践。来自医疗保健行业,银行和金融服务,零售和制造行业的现实生活示例表明,这种整合为业务带来了运营增强,并对客户和整体组织绩效产生了积极影响。建议:这项工作提供了一个有用的框架,用于研究和构建ML在数据仓库中的集成,这是从理论角度到实际仓库的过渡。它为组织提供了实用建议,并强调了与业务目标,数据质量,体系结构,安全和培训的选择相关的集成策略。本研究还设想了未来的趋势,例如边缘计算,汽车和可解释的AI,并提供了有关如何利用这种技术互补性的指南。生成的见解可帮助决策者和从业者了解利用ML-DATA仓库集成作为当代商业环境中转向数据驱动方法的战略资产的可能性。
近年来,由于能够从数据中提取模式并产生有价值的决策知识,因此对深度学习技术的使用已获得流行。深层神经网络的几种应用正在能量领域增长。建立越来越可持续的建筑物或工厂的挑战使使用机器学习技术来预测他们所需的能源需求并重新分配能源以避免浪费。在与可持续性有关的所有情况下,能源效率至关重要,并且使用深度学习技术可以准确预测能源需求,从而使能源系统能够根据需要将能源重新分配给客户。但是,在此类应用程序中要处理的数据量增加提出了重大挑战。深度神经网络变得越来越复杂,需要许多隐藏层来处理数据。此外,文献中的现有模型需要对超参数进行临时调整,以最大程度地提高准确性。为了解决这个问题,已经开发了几种技术来生成自动深度神经网络,以改善多元时间序列问题的性能,例如在能源需求预测的情况下。所有这些技术均表示为自动化机器学习(AUTOML)[1],可以分为两种类型:神经体系结构搜索(NAS)和超参数优化(HPO)。神经体系结构搜索方法基于优化算法,以选择适合数据集的最佳神经网络体系结构,并避免过度适应以达到最佳模型精度。另一方面,超参数优化选择了最大化这种网络性能的神经网络体系结构的最佳超参数。可以将预测客户的能源需求(例如建筑物或工厂)的问题建模为多元时间序列,因为几个变量可能会影响所需能源的需求。在[2]中,已经证明了变量如何在多变量时间序列预测中相互影响,并且使用元神经算法可以帮助选择每个变量的最佳预测指标,从而提高预测的准确性。在这项研究工作中,我们采用了自动化机器学习算法,称为GP-NAS(通用神经架构搜索),发表在[3]中,设计了一种神经网络体系结构,可最大程度地提高医院设施中能源消费的性能[4]。我们的目标是展示如何在多元时间序列预测问题中使用我们的算法,从而为设计在该领域使用的深神经网络体系结构提供了宝贵的贡献。
近年来,在摄影成像中使用机器学习(ML)技术的使用激增。作为评估潜在冠状动脉疾病(CAD)患者的成像方式的数量,并且该技术继续改善,在做出临床判断时,可以考虑大量数据。但是,大量变量和越来越多的成像数据可以使准确评估患者的挑战。人工智能(AI)和ML可以通过基于广泛的临床和成像变量的有用提示来帮助这一过程[1]。的确,ML算法已被证明是患者风险分层和诊断评估中的宝贵工具[2,3]。冠状动脉层析成像血管造影(CCTA)是一种用于评估CAD冠状动脉动脉的非侵入性诊断程序。它具有高的负预测值,允许负CCTA结果有效排除显着的CAD [4,5]。另一个重要的非侵入性诊断测试是单光子发射计算机断层扫描(SPECT),它主要评估冠状动脉狭窄和指南管理的功能意义。使用CCTA和SPECT添加了疑问涉嫌CAD的患者对牙菌斑和灌注负担的评估[6-8]。普遍的临床预测方法通常涉及专家选择潜在的相关变量,然后进行回归/分类分析。Automl旨在减轻开发出良好表现ML管道所需的计算成本和人类专业知识[9,10]。ML的最新进展使这种经典的方法限制性(仅使用一种模型类型),效率低下(需要用于超参数的手动调整)并可能有偏见(预测指标前定位)。尽管医疗保健中基于ML的预测模型的进步,但采用这些模型的一个主要障碍是,其中许多被认为是“黑匣子”,这是指缺乏可解释性[11]。呼吁对这些模型的运作方式进行更多研究[12-15]。无法解释预测模型可以侵蚀对它们的信任,尤其是在决策可能会带来严重后果的心血管医学中。在医学中,黑匣子模型将发挥重要作用,在许多情况下,与我们缺乏完全生物学或临床理解的其他领域没有太大的不同[16]。但是,就像了解疾病和疗法背后的机械主义是有益的一样,对ML模型如何得出的结论有了更大的了解[17]也是有帮助的。对可解释的ML的研究激增,以解决这个问题[18]。已经开发了探索AI预测背后推理的各种方法[19,20]。一种有效的方法是建立一个次要,更透明的模型,例如决策树或随机森林,输入
美国政府最终用户:Oracle计划(包括任何操作系统,集成软件,任何已嵌入,安装或在交付的硬件上激活的程序,以及此类程序的修改)和Oracle计算机文档或美国政府最终用户提供或访问的其他Oracle数据是“商业计算机软件”,“商业计算机软件”,“商业计算机软件文档”,“商业计算机软件”,“商业计算机软件”,“有限的权利数据”或“有限的权利”适用于适用于适用的适用性,或者适用于适用性的适用性,并适用于适用于适用性。因此,使用,复制,重复,释放,显示,披露,修改,衍生作品的准备和/或适应i)Oracle程序(包括任何操作系统,集成软件,嵌入,安装或激活的任何程序,在此类程序中嵌入或激活的任何程序,对此类程序的限制和其他限制),III和/或III IS IS III和/或/或/或/或/或/或/或/或/或/或/或/或/或/或/或/ii ii III),IS或/或/或/或/或/或/或/或/或/或/或/或III III IS IIS)在适用的合同中。管理美国政府使用Oracle Cloud Services的条款由适用的此类服务的合同定义。没有其他权利授予美国政府。
人类健康是由遗传学(G)和环境(E)决定的。这在暴露于同一环境因素的个体中清楚地说明了这一点。尚未开发出基因 - 环境相互作用(GXE)效应的定量度量,在某些情况下,甚至还没有就该概念达成明确的共识。例如,癌症是否主要来自“运气不好”还是“糟糕的生活方式”。在本文中,我们提供了一组GXE相互作用的示例,作为发病机理的驱动因素。我们强调了epige-netic法规如何代表分子碱基的共同连接方面。我们的论点收敛于GXE记录在细胞表观基因组中的概念,该概念可能代表了解宣告这些多半复杂的调节层的关键。开发一个解码此表观遗传信息的钥匙将提供疾病风险的定量度量。类似于引入估计生物年龄的表观遗传时钟,我们挑衅地提出了“表观遗传评分表”的理论概念,以估计疾病风险。