随着人工智能产品的普及,人类和人工智能越来越多地合作做出决策。为了使这种类型的合作取得成功,人类需要了解人工智能的能力,以便有效地校准他们的信任。在这些合作关系中,以人类可以理解的方式解释决策和预测至关重要,以鼓励信任校准。可解释人工智能领域专注于将可解释性融入人工智能,但旨在使人工智能模型更具可解释性。因此,这项研究通常从以模型为中心的角度而不是以人为中心的角度来处理解释。与此同时,行业研究人员已经制定了指导方针,以帮助界面设计师有效地生成用户友好的解释。然而,这些指导方针通常过于宽泛,无法有效指导行业设计师的日常工作。我们的研究通过两种方法解决了这一差距:一个实证实验,研究人们如何回应解释以及哪些类型的解释对信任校准最有帮助;以及一个教育资源,帮助行业设计师了解用户可能有什么问题,以及使用环境如何影响他们可能使用的解释。我们的实验结果表明,解释并不总是有助于信任校准,实际上可能会损害信任校准,尤其是面对自我能力较低的新手用户时。我们对行业设计师进行的探索性访谈和可用性测试表明,人们渴望一种全面但易于访问的教育资源,以转化我们实验等研究并指导可解释的 AI 产品界面的设计。关键词
交流是构造障碍患者的优先事项,例如中风和肌萎缩性侧索硬化症(ALS)1。患有疾病的人会损害沟通报告,增加了隔离,抑郁症和生活质量下降的速度2,3;失去沟通可能会确定一个人是否会在高级ALS 4中追求或撤回维持生命的护理。虽然可以使用现有的增强性和辅助通信技术,例如头部或眼动仪,但随着患者失去自愿性肌肉控制5,它们的信息传输率较低,并且越来越难以使用。大脑计算机接口是一种有前途的通信技术,可以直接从皮质神经信号中解码用户的预期语音6。开发语音神经假期的努力主要是基于研究的研究,这些数据是从经受电生理监测的能力强大的扬声器进行回顾性分析的,以实现临床目的7-16。几个小组已经进行了实时的脑界面研究,以使用植入的皮质摄影(ECOG)17-20恢复丢失的语音,其中包括在17期发表的报告,或物质内多电极阵列21。最近的两份报告通过将尝试的语音通过尝试到音素(单词的基础)而产生的皮质神经信号并将这些音素组装成在计算机屏幕上显示的单词和/或句子,从而建立了“大脑到文本”的语音表现19,21。这些研究实现了通过单词错误率量化的沟通性能,为25.5%,1,024字词汇19和23.8%,词汇为125,000字,词汇21,并需要大约17个小时的记录才能收集足够的训练数据以获得该水平的表现。
气候变化将加剧自然危害,例如风暴,洪水,干旱和极端温度。仅在2022年,与气候和气候有关的灾难影响了1.85亿人,并造成了超过2000亿美元的经济损失(Cred,2023)。预测迫在眉睫的事件的影响以及根据未来的社会经济途径确定气候风险对于社会,人道主义,政治,社会经济和生态问题的决策至关重要(Smith等人,2014年)。此类计算中不确定性的一个主要来源是脆弱性(Rougier等,2013)。通常以影响功能1建模,该功能1根据危险强度,产生受影响的暴露百分比,脆弱性很难确定。Using hazard footprints, exposure, and recorded impacts from past events, researchers therefore employ calibration techniques to estimate unknown impact functions and use these functions for future risk projections or impact forecasts ( Eberenz et al., 2021 ; Kam et al., 2023 ; Lüthi et al., 2021 ; Riedel et al., 2024 ; Röösli et al., 2021 ; Schmid等人,2023年; Welker等人,2021年)。
预计商业航天业很快将爆发式增长,成为一个价值万亿美元的产业,但新太空领域的专利保护却在很大程度上被这个由技术创新和快速发展驱动的行业所忽视。由于大型商业航天公司依赖几乎不可能独立发明或逆向工程的商业秘密,因此发明很少得到披露。发明披露和保密的好处是众所周知的,但尚未有针对航天工业发明的分析。本文通过分析航空航天工业中常见的知识产权实践并运用知识产权理论,填补了文献中的空白。我还回顾了政府过去在航空航天工业知识产权方面的行动。我发现商业航天行业的参与者几乎没有动力披露他们的发明。这种缺乏激励可能会损害或减缓商业航天业的扩张。本文可能对希望通过知识产权政策继续扩张和创新商业航天业的政策制定者有所帮助。
自主驾驶系统依靠精确的轨迹前词进行安全有效的运动计划。尽管努力提高预测准确性,但由于数据噪声和不完整的观察,固有的不确定性仍然存在。许多策略需要将预测结果形式化为分布,并利用差异代表不明显。然而,我们的实验研究表明,现有的轨迹预测模型产生了不可靠的不可估计的估计,需要进行其他定制的核心过程。另一方面,直接将电流校准技术应用于预测输出可能会产生亚最佳结果,因为对所有预分解使用了通用缩放器并忽略了信息性的数据提示。在本文中,我们提出了使用调节器(CCTR)的定制校准温度,这是一个通用框架,可以校准外部分布。具体来说,CCTR 1)采用基于校准的正规器将输出差异与预测与地面真相之间的差异相一致,并且2)使用上下文和历史信息为每个预测提供了每个预测的量身定制的温度缩放器。涉及多种谓词和计划方法的广泛评估表明,CCTR比现有的校准算法和不确定性意识方法的优越性,校准质量的11% - 22%的显着提高,运动计划的17%-46%。
自主驾驶系统依靠精确的轨迹前词进行安全有效的运动计划。尽管努力提高预测准确性,但由于数据噪声和不完整的观察,固有的不确定性仍然存在。许多策略需要将预测结果形式化为分布,并利用差异代表不明显。然而,我们的实验研究表明,现有的轨迹预测模型产生了不可靠的不可估计的估计,需要进行其他定制的核心过程。另一方面,直接将电流校准技术应用于预测输出可能会产生亚最佳结果,因为对所有预分解使用了通用缩放器并忽略了信息性的数据提示。在本文中,我们提出了使用调节器(CCTR)的定制校准温度,这是一个通用框架,可以校准外部分布。具体来说,CCTR 1)采用基于校准的正规器将输出差异与预测与地面真相之间的差异相一致,并且2)使用上下文和历史信息为每个预测提供了每个预测的量身定制的温度缩放器。涉及多种谓词和计划方法的广泛评估表明,CCTR比现有的校准算法和不确定性意识方法的优越性,校准质量的11% - 22%的显着提高,运动计划的17%-46%。
摘要 - 使用面部视频的基于视频的心脏和呼吸率测量比传统的基于接触的传感器更有用和用户友好。但是,当前的大多数深度学习方法都需要地面真相脉冲和呼吸道波来进行模型训练,这很昂贵。在本文中,我们提出了校准Phys,这是一种基于视频的心脏和呼吸率测量方法,可以在多个相机之间校准。Calibibrationphys通过使用由多个相机同时捕获的面部视频来训练无监督标签的深度学习模型。对比度学习,以使使用多个摄像机通过同步视频预测的脉搏和呼吸波为正,而来自不同视频的脉冲和呼吸波为阴性。校准还通过数据增强技术提高了模型的鲁棒性,并成功利用了特定相机的预训练模型。利用两个数据集的实验结果表明,校准范围的表现优于先进的心脏和呼吸速率测量方法。由于我们仅使用来自多个相机的视频来优化摄像头模型,因此我们的方法使使用任意摄像机进行心脏和呼吸率测量很容易。
3美国美国美国媒体推进实验室摘要气候建模联盟(CLIMA)正在开发旨在从数据中学习并使用最先进的计算技术的地球系统模型(ESM)。Clima的ESM结合了多个子模型,包括土地,大气,海洋和海冰。我们将介绍Clima的土地模型Climalm,该模拟物质地面过程。climalsm是高度模块化的,分为组成部分,包括土壤,雪,冠层和河流,每种都可以单独运行,校准或组合在一起以串联运行。CLIMALSM的模块化扩展到组件本身内的参数化,从而使新用户可以轻松添加和测试其他参数化模型。我们将使用全局数据演示如何使用全局数据来校准Climalsm,并以太阳能诱导荧光的空间观测为特定示例。关键字
使用物理仪器(即温度计)对环境的干预措施产生仪器读数,这些读取物收集到数据集中,然后是测量结果(从这些数据集中推断出的特定因素贡献的实际估计值)。这种推论在很大程度上取决于背景知识(以气候模型的形式)和统计数据,后者在归因研究中起着至关重要的作用,这是由于气候数据中存在的噪声水平很高。尽管在过去的三十年中,这种测量样过程的基本脚手架基本上保持不变,但细节却没有。的确,上面概述的所有元素都发生了变化:气候科学家收集了更多数据,建立了更复杂和准确的模型,并开发了新的统计技术。这些更改中的前两个应该是熟悉的 - 收集更多数据并建立更准确的理论结构(相对)是科学过程的部分。第三次不太如此。我们应该如何理解统计技术的变化?是什么使一种统计技术在气候科学的背景下“更好”?以及对更好统计技术的一般渴望如何转化为特定的变化?目前的论文解决了这些问题。,我详细说明了两个结论。这种人工艺性观点既与以前的模型评估都很好地保持一致,并有助于解释许多i认为,在归因研究中发现的统计技术的变化类似于测量的遗传学中所谓的“校准”,在测量过程中使用的仪器或模型会改变,其目标是产生更精确,更准确,更准确的测量结果。首先,我们应该理解统计技术的变化是对“工具”的改变(统计学家称为“统计模型”),也类似于Bokulich(2020a)和Tal(2017)等讨论中发现的校准范围。尽管我的例子说明了涉及测量的推论工具,而不是对物理仪器的更熟悉的更改,但我表明它们在很大程度上具有相同的动机和认识论含义。第二,统计模型应根据我所说的“人为”观点(借用Knuuttila 2011的术语)来判断,根据该观点,新模型比旧模型要好于旧的旧模型,因为它在许可准确的推论方面更可靠(例如,在世界上代表世界上任何实际过程)。
免责声明本文件是作为由美国政府机构赞助的工作的帐户准备的。美国政府和劳伦斯·利弗莫尔国家安全,有限责任公司,或其任何雇员均不对任何信息,设备,产品或流程的准确性,完整性或有用性承担任何法律责任或责任,或承担任何法律责任或责任,或者代表其使用不会侵犯私有权利。以本文提及任何特定的商业产品,流程或服务,商标,制造商或其他方式不一定构成或暗示其认可,建议或受到美国政府或Lawrence Livermore National Security,LLC的认可。本文所表达的作者的观点和意见不一定陈述或反映美国政府或劳伦斯·利弗莫尔国家安全,有限责任公司的观点和观点,不得用于广告或产品代表目的。