引言:量子机器学习 (QML) [1] 使用参数化量子电路 [2] 作为统计模型,近年来引起了广泛关注,并被应用于自然科学 [3-8] 或生成建模 [9-13]。即使 QML 模型具有高表达能力 [14] 且在某些特定情况下表现出优于经典模型 [15,16],但在深度神经网络时代,量子计算机 [17] 能获得什么样的优势仍不清楚。另一方面,量子数据可能是应用 QML 的自然范例,量子优势已得到证实 [18]。人们希望可以通过量子传感器 [19] 收集量子数据,并最终直接连接到量子计算机。在本文中,我们模拟了通过在量子设备上直接构建量子数据来处理量子数据的可能性。我们使用变分基态求解器来获得真实基态的近似值,以模拟嘈杂的真实世界数据。具体而言,本信函讨论了使用监督学习方法计算哈密顿量 H 的基态相图。即使已经针对二元情况 [ 20 , 21 ] 探索了类似的问题,具有多个类别 [ 22 ] 并在超导平台上进行了计算 [ 23 ],所有这些方法都受到构造限制,即瓶颈。事实上,由于训练需要标签,并且因为它们是通过分析或数值计算的,这些技术只能加快
引言:量子机器学习 (QML) [1] 使用参数化量子电路 [2] 作为统计模型,近年来引起了广泛关注,并被应用于自然科学 [3-8] 或生成建模 [9-13]。即使 QML 模型具有高表达能力 [14] 且在某些特定情况下表现出优于经典模型 [15,16],但在深度神经网络时代,量子计算机 [17] 能获得什么样的优势仍不清楚。另一方面,量子数据可能是应用 QML 的自然范例,量子优势已得到证实 [18]。人们希望可以通过量子传感器 [19] 收集量子数据,并最终直接连接到量子计算机。在本文中,我们模拟了通过在量子设备上直接构建量子数据来处理量子数据的可能性。我们使用变分基态求解器来获得真实基态的近似值,以模拟嘈杂的真实世界数据。具体而言,本信函讨论了使用监督学习方法计算哈密顿量 H 的基态相图。即使已经针对二元情况 [ 20 , 21 ] 探索了类似的问题,具有多个类别 [ 22 ] 并在超导平台上进行了计算 [ 23 ],所有这些方法都受到构造限制,即瓶颈。事实上,由于训练需要标签,并且因为它们是通过分析或数值计算的,这些技术只能加快
在现实条件下评估心理负荷是确保执行需要持续注意力的任务的工人表现的关键。先前的文献已经为此采用了脑电图 (EEG),尽管已经观察到脑负荷与脑电图的相关性因受试者和身体压力而异,因此很难设计出能够同时呈现不同用户可靠表现的模型。领域适应包括一组策略,旨在提高机器学习系统在训练时对未见数据的性能。然而,这些方法可能依赖于对所考虑的数据分布的假设,而这些假设通常不适用于 EEG 数据的应用。受这一观察的启发,在这项工作中,我们提出了一种策略来估计从不同受试者收集的数据中观察到的多种数据分布之间的两种差异,即边际和条件偏移。除了阐明对特定数据集成立的假设之外,使用所提出的方法获得的统计偏移估计值还可用于研究机器学习管道的其他方面,例如定量评估领域适应策略的有效性。具体来说,我们考虑了从在跑步机上跑步和在固定自行车上踩踏板时执行心理任务的个体收集的脑电图数据,并探索了通常用于减轻跨受试者变异性的不同标准化策略的影响。我们展示了不同的标准化方案对统计变化的影响,以及它们与在训练时对未见过的参与者进行评估的心理工作量预测准确性的关系。
偏向多数人群的算法偏差对机器学习在精准医疗中的应用构成了关键挑战。在本文中,我们评估了脑功能磁共振成像行为表型预测模型中的这种偏差。我们使用两个由混合族裔/种族组成的独立数据集(青春期前与成年)检查了预测偏差。当使用以白人美国人(WA)为主的数据训练预测模型时,非裔美国人(AA)的样本外预测误差通常高于 WA。这种对 WA 的偏差对应于模型学习到的更多类似 WA 的大脑行为关联模式。当仅使用 AA 训练模型时,与仅使用 WA 或相同数量的 AA 和 WA 参与者进行训练相比,AA 预测准确度有所提高,但仍低于 WA。总体而言,结果表明,需要谨慎对待当前大脑行为预测模型在少数族裔人群中的应用,并进行进一步研究。
架构有可能彻底改变许多人类活动,包括物流、医学和法律 2-4 ;然而,这些系统的负责任和安全地部署取决于它们是否能被人类利益相关者理解。5 针对这一问题提出了两种解决方案:一是设计本质上可解释或透明的系统,这通常会在性能上有所妥协;二是开发定制解决方案来解释一个模糊系统的事后决策。6 在本文中,我们提出了第三种方法,其中可解释性被分析为促进人类理解人工智能 (AI) 系统的问题。因此,我们提出了一种解释人工智能系统的通用方法,通过明确分析提供信息使人类能够理解和预测人工智能的问题。本文的目的是介绍一个统一的框架,从认知科学的角度以可分解组件的角度思考可解释人工智能。我们展示了这个框架如何通过阐明和模块化现有可解释人工智能系统的不同组件为先前的研究提供新的见解。一旦确定,就可以验证这些组件,并讨论这种验证对 XAI 解决方案的普遍性的影响,为 XAI 研究增加了一个新的维度。近年来,有关可解释 AI 的文献激增,7 但仍然缺乏 XAI 技术的连贯理论框架,8 并且现有的分类法是基于解释技术背后的技术基础,而不是其务实目标。这种理论的缺乏阻碍了 XAI 研究,因为它掩盖了哪些经验可以在研究和应用之间安全地转移,以及哪些组件需要在新的环境中重新验证。结果,它既降低了知识积累的速度,也降低了跨部门安全、可解释的 AI 系统的部署速度。此外,大多数 XAI 解决方案往往是由软件工程师为工程师设计的,因此没有考虑如何向非技术用户解释目标系统。 9-12 这是有问题的,因为成功的解释显然取决于用户及其目标,13 如果成功部署了 AI 系统,软件工程师也只是用户的一小部分。可解释的 AI 是一个复杂的问题,既有技术成分,也有心理成分。以结构化和规范的方式阐述 XAI 问题的理论框架可能会揭示以前看似不相关的不同方法和结果之间的关联。这样的框架还将 XAI 问题分解为代表基本组件和依赖关系的抽象,可以单独验证。此外,这种模块化方法将支持部署,因为它允许对解释的哪些子组件可以推广到哪些上下文进行正式测试。我们提出贝叶斯教学作为这样一个框架,它将解释形式化为教师和学习者之间的一种社会行为。在下一节中,我们将解释贝叶斯教学如何将广泛的XAI系统抽象为以下四个组成部分(见表1):(a)目标推理,(b)解释,(c)被解释者模型,(d)解释者模型。具体来说,我们展示了如何应用贝叶斯教学来分解流行的XAI方法类。然后,我们说明如何通过用户研究半独立地验证分解后的部分,并反思贝叶斯教学如何在XAI研究和应用中促进以人为本。最后,我们讨论分解部分的泛化,包括对组件的操作和重组的评论。
方法:这是一项人工智能的前瞻性推理测试,针对 2011 年至 2019 年期间澳大利亚悉尼一家医院的癫痫患者的近 14,590 小时成人脑电图数据。推理集包括不同类型和频率癫痫发作的患者,年龄和脑电图记录时间跨度很大。人工智能 (AI) 是一个卷积长短期记忆网络,基于美国数据集进行训练。澳大利亚的数据集大约是美国训练数据集的 16 倍,发作间隔期(癫痫发作之间)很长,比训练集更加逼真,使我们的假阳性结果高度可靠。我们在人工智能辅助模式下,由人类专家裁判和由专家神经病学专家和脑电图专家组成的结果审查小组验证了我们的推理模型,共进行了 66 次,以证明在时间缩短一个数量级的情况下实现了相同的性能。
心理学和神经科学中的抽象认知模型广泛认为人脑保持了任务的抽象表示。这个假设对于解释我们如何快速学习,创造性思考和灵活地采取行动的理论至关重要。然而,缺乏可见生成的抽象任务表示的神经证据。在这里,我们报告了一个实验范式,该范式需要形成这样的表示,以在新的条件下自适应地行动而无需反馈。使用功能性磁共振成像,我们观察到抽象任务结构在左侧前额叶皮层,双侧前序和下顶层皮质内表示。这些结果为我们可以验证其影响的环境中长期支持的抽象任务表示的神经实例化提供了支持。这样的表示可以提供大量的行为灵活性,而无需额外的经验,这是人类认知的重要特征。
。CC-BY 4.0 国际许可,根据 (未经同行评审认证)提供,是作者/资助者,他已授予 bioRxiv 永久展示预印本的许可。它是此预印本的版权持有者,此版本于 2021 年 3 月 14 日发布。;https://doi.org/10.1101/2021.03.10.434856 doi:bioRxiv 预印本
摘要。在过去的十年中,大规模的癌症法学研究强调了患者分子方案的多样性以及利用此信息在正确的时间向正确患者提供正确的药物的重要性。学习预测模型的关键挑战包括OMIC数据的高维度,可用数据点的限制以及生物学和临床因素的异质性影响患者反应。多任务学习(MTL)技术已被广泛探索以解决用于体外药物反应模型的数据集限制,而域适应性(DA)已被用来扩展它们以扩展它们以预测体内响应。在这两个转移学习设置中,与单任务(域)学习者相比,某些任务(或域)的嘈杂数据可以实质上为其他任务提供了绩效,即导致负转移(NT)。我们描述了一种新颖的多任务无监督的DO-主要适应方法(TUGDA),该方法通过量化预测变量的不确定性并加权其对共享域/任务特征表示的影响来解决统一框架中解决这些局限性。tugda的能力更多地依赖于低确定性的预测因子,与最先进的方法相比,体外模型的阴性转移病例显着减少了体外模型的负转移病例(63%的药物和94%的药物)。针对体内环境的域适应性,TUGDA在患者衍生的异种移植物中的12种药物中有6种改进了性能,尽管接受了无监督的方式接受培训,但在TCGA患者数据集中有22种药物中有7种。TUGDA避免负转移的能力,因此具有关键能力,因为我们试图将多种药物响应数据集整合在一起,以将一致的预测模型与体内效用构建一致的预测模型。