从演示和成对偏好推断奖励函数是将强化学习 (RL) 代理与人类意图相结合的良好方法。然而,最先进的方法通常专注于学习单一奖励模型,因此很难权衡来自多位专家的不同奖励函数。我们提出了多目标强化主动学习 (MORAL),这是一种将社会规范的不同演示组合成帕累托最优策略的新方法。通过维持标量权重的分布,我们的方法能够以交互方式调整深度 RL 代理以适应各种偏好,同时无需计算多个策略。我们在两种场景中通过实证证明了 MORAL 的有效性,这两种场景模拟了交付和紧急任务,需要代理在存在规范冲突的情况下采取行动。总的来说,我们认为我们的研究是朝着具有学习奖励的多目标 RL 迈出的一步,弥合了当前奖励学习和机器伦理文献之间的差距。
节省时间和更快的综合企业可用性,这尤其是当今对快速市场推出的需求。与带有粉末床的添加过程不同,例如激光粉末床融合,可用于生产高度构图的几何形状,基于粉末喷嘴的基于粉末喷嘴的进程,例如激光定向能量沉积(DED-L),也称为激光金属沉积(LMD),可构成组合模型和构建率和构建率和高构建率和乘积和乘积和乘积和乘积。Ti - 6AL - 4V等钛合金在工业应用中广泛使用。由于其出色的机械函数,低密度以及出色的耐腐蚀性和生物相容性,因此它们在医疗和牙科应用中或飞机扇区中的金属组件中使用,例如在高温下在涡轮机工作中的压缩机叶片中应用。[2 - 4]取决于制造过程的条件以及最终的后热机械治疗的特征,Ti - 6AL - 4V可以具有不同的微结构特征,这显着影响其性质。[2]两个阶段α和β的先验β晶粒的形态和排列是这些特征的例子。deD-l分量的微结构主要是通过具有柱状形状的先验β晶粒来表征的。[4,5]常规钛合金中的两个极端排列的极端情况是层状微结构和e词微结构。两种类型的微观结构都可以具有两个阶段的细节和粗整体。[2,6]相位的大小(纤维或粗糙)及其排列(层层或等词)会影响机械性能。这些依赖性已被广泛研究,例如,关于强度,螺旋,蠕变和疲劳行为的已知。
从演示和成对偏好推断奖励函数是将强化学习 (RL) 代理与人类意图相结合的良好方法。然而,最先进的方法通常专注于学习单一奖励模型,因此很难权衡来自多位专家的不同奖励函数。我们提出了多目标强化主动学习 (MORAL),这是一种将社会规范的不同演示组合成帕累托最优策略的新方法。通过维持标量权重的分布,我们的方法能够以交互方式调整深度 RL 代理以适应各种偏好,同时无需计算多个策略。我们在两种场景中通过实证证明了 MORAL 的有效性,这两种场景模拟了交付和紧急任务,需要代理在存在规范冲突的情况下采取行动。总的来说,我们认为我们的研究是朝着具有学习奖励的多目标 RL 迈出的一步,弥合了当前奖励学习和机器伦理文献之间的差距。
收到日期:2020 年 1 月 5 日;修订日期:2020 年 4 月 17 日;接受日期:2020 年 5 月 28 日 摘要:确定隧道支撑是隧道工程领域的一个重要争论,它确保了隧道的稳定性和安全性。Q 系统分类是一种用于确定岩石隧道支撑系统的技术。问题在于无法获得支撑系统所需的所有参数。另一方面,这种访问非常昂贵且耗时。因此,不可能在所有情况下确定 Q 值。本文使用 SPSS 程序确定 Q 系统中最有影响力的参数。然后,采用多元回归 (MVR) 和遗传算法 (GA) 方法,提出了一种使用三个有影响的参数预测 Q 值的关系。为此,使用了 140 个实验数据。为了评估获得的模型,使用了 34 个不在原始数据集中的新实验数据。本文的创新之处在于不再使用六个参数,而是使用对 Q 值影响最大的三个参数来确定 Q 值。在本研究中,MVR 模型(训练数据的 RMSE = 2.68、相关系数 = 0.81,测试数据的 RMSE = 2.55、相关系数 = 0.80)表现优于 GA 模型(训练数据的 RMSE = 2.90、相关系数 = 0.82,测试数据的 RMSE = 2.61、相关系数 = 0.84)。关键词:遗传算法、影响参数、多变量回归、Q 系统、隧道支护。1. 引言如今,地下空间在发达国家和发展中国家的使用越来越多。地面空间的限制、核电站的建设以及弹药和武器库的建设使得利用地下空间和设计隧道成为必然。
仅用于研究使用。不适用于诊断程序。©2021 Thermo Fisher Scientific Inc.保留所有权利。Restek和RTX是Restek Corp. Agilent和J&W的商标,是Agilent Technologies的商标。除非另有说明,否则所有其他商标都是Thermo Fisher Scientific及其子公司的财产。此信息作为Thermo Fisher Scientific Inc.产品的功能的一个例子。无意以任何可能侵犯他人知识产权的方式来鼓励使用这些产品。规格,条款和定价可能会发生变化。并非所有产品都在所有位置可用。请咨询您的当地销售代表以获取详细信息。AB000401-EN 1121C
摘要 我们提出了一种眼镜式可穿戴设备,以不引人注目的方式从人脸检测情绪。该设备旨在用户佩戴时自然、连续地收集来自用户脸部的多通道响应。多通道面部响应包括局部面部图像和生物信号,包括皮肤电活动 (EDA) 和光电容积图 (PPG)。我们进行了实验以确定可穿戴设备上 EDA 传感器的最佳位置,因为 EDA 信号质量对感应位置非常敏感。除了生理数据外,该设备还可以通过内置摄像头捕捉代表左眼周围局部面部表情的图像区域。在本研究中,我们开发并验证了一种使用从设备获得的多通道响应来识别情绪的算法。结果表明,仅使用局部面部图像的情绪识别算法在对情绪进行分类时的准确率为 76.09%。使用包括 EDA 和 PPG 在内的多通道数据,与单独使用局部面部表情相比,准确率提高了 8.46%。这种眼镜式可穿戴系统以自然的方式测量多通道面部反应,对于监测用户日常生活中的情绪非常有用,在医疗保健行业具有巨大的应用潜力。
摘要:结构健康监测被认为是提高航空安全性和降低运营成本的可行解决方案,它可以根据机身的实际状况实现一种新颖的维护方法,从而降低定期检查带来的运营成本。然而,净收益几乎没有得到证明,而且目前还不清楚这种自主系统的实施如何影响飞机层面的性能。为了弥补这一差距,本文提出了一个系统分析,其中集成永久连接的传感器(用于诊断)的成本和重量对飞机主要性能的影响。通过多学科飞机分析框架,将飞机运行空重的增量与直接运营成本方面的可能收益进行比较,以确定盈亏平衡点。此外,该分析允许为结构健康监测系统建立设计指南,使飞机更安全,而不会产生任何经济损失。结果表明,运营成本低于参考飞机,最大起飞重量最多增加 4%。论文研究结果表明,从概念设计阶段开始就应考虑状态监测策略,因为这样可以最大限度地发挥这种创新技术的影响。然而,这涉及全新飞机的设计,而不是对现有飞机的改造。
可解释人工智能 (XAI) 是机器学习的一个新兴研究课题,旨在揭示 AI 系统的黑箱选择是如何做出的。该研究领域研究决策制定中涉及的措施和模型,并寻求解决方案来明确解释它们。许多机器学习算法无法说明决策的方式和原因。目前使用的最流行的深度神经网络方法尤其如此。因此,这些黑箱模型缺乏可解释性,可能会削弱我们对 AI 系统的信心。XAI 对于深度学习驱动的应用越来越重要,尤其是对于医疗和医疗保健研究,尽管一般来说,这些深度神经网络可以在性能上带来惊人的回报。大多数现有 AI 系统的可解释性和透明度不足可能是成功实施和将 AI 工具集成到常规临床实践中并不常见的主要原因之一。在本研究中,我们首先调查了 XAI 的当前进展,特别是其在医疗保健应用方面的进展。然后,我们介绍了利用多模式和多中心数据融合的 XAI 解决方案,并随后在两个真实临床场景的展示中进行了验证。全面的定量和定性分析可以证明我们提出的 XAI 解决方案的有效性,由此我们可以设想在更广泛的临床问题中成功应用。
通过数据驱动,从大规模多模态脑成像数据中发现图像衍生表型 (IDP),通过将 IDP 与受试者的人口统计、行为、临床和认知指标(即非成像衍生表型或 nIDP)联系起来,对神经科学和临床研究具有巨大潜力。然而,目前的方法主要基于无监督方法,而不使用 nIDP 中的信息。在本文中,我们提出了监督式 BigFLICA(SuperBigFLICA),这是一种用于 IDP 发现的半监督、多模态和多任务融合方法,它同时整合了来自多种成像模态和多个 nIDP 的信息。SuperBigFLICA 具有计算效率高的特点,并且在很大程度上避免了参数调整的需要。我们使用英国生物库脑成像数据集(包含约 40,000 名受试者和 47 种模式)以及超过 17,000 个 nIDP,表明 SuperBigFLICA 增强了 nIDP 的预测能力,与通过传统专家知识和无监督学习方法得出的 IDP 相比(平均 nIDP 预测准确率提高高达 46%)。它还可以学习可以预测新 nIDP 的通用成像特征。对 SuperBigFLICA 算法的进一步实证分析证明了其在不同预测任务中的稳健性,以及在预测健康结果和认知 nIDP(例如流体智力和高血压评分)时得出具有生物学意义的 IDP 的能力。