高速喷气式飞机的飞行员需要经过多年的高级训练才能获得出色的操控能力。如果能够将飞行员和其他领域专家的技能、知识和偏好提炼成一个能够捕捉真实操控行为的软件模型,那么这种方法将具有重大的实用价值。这种模型的可扩展性将使其可用于战略规划演习、培训以及其他软件系统的开发和测试。这将使人类驾驶专业知识这一稀缺资源获得更大的回报。这一愿景面临着实际挑战,即准确地获取所需知识以将其编入自动化系统。在许多需要直观决策和快速运动控制的情况下,专家一看到良好的操控性就知道,但并不总是能用形式或语言术语表达原因 [1]。∗ 显性知识获取策略也可能非常耗时,任何依赖专家演示的方法也是如此。这促使人们采用使用更稀疏数据源的基于学习的方法。鉴于透明度对于安全关键型航空应用的重要性 [ 2 , 3 ],任何此类方法都必须学习可解释(即人类可读和可理解)的专家知识模型,以促进信任和验证。本文提出了一个可能的解决方案。我们使用人工强化学习 (RL) 代理来生成 si 数据集
19. 摘要(如有必要,请继续修改,并通过块号标识)目前,人工智能和机器人领域的研究人员对寻找更有效的方法将与自动驾驶汽车的任务规划和控制相关的高级符号计算与低级车辆控制软件联系起来有着浓厚的兴趣。此类控制涉及许多过程,其多样性导致了许多通用软件架构的提案,旨在为相关软件组件的组织和交互提供高效而灵活的框架。理性行为模型 (RBM) 就是根据这些要求而设计的,它由三个级别组成,分别称为策略级、任务级和执行级。每个级别都基于不同的执行机制来影响支持解决全局控制问题的计算。 RBK 架构的独特之处在于,它通过指定不同的编程范例来实现每个软件级别。具体来说,RBM 在战略级别使用基于规则的编程,因此任务专家无需在较低级别重新编程即可在现场重新配置任务。战术级别将车辆行为实现为使用基于对象的语言(如 A&R)编程的软件对象的方法。这些行为由战略级别的规则满足发起,因此将车辆行为本地化。
HAVELSAN 开发的虚拟环境中的部队 (FIVE) 模拟器软件利用各种虚拟战争装备(如武器、传感器和通信工具等),以安全且经济高效的方式提供全面的战术和作战训练环境。目前,管理 FIVE 实体的行为模型高度依赖于现场专家和系统工程师开发的基于规则的行为。但是,FIVE 软件的基于规则的操作需要大量编程和现场专家的指导,因此劳动密集度很高。此外,随着场景的复杂性,这项任务的复杂性和负担显著增加。此外,具有基于规则行为的虚拟实体对其环境具有标准且可预测的反应。因此,在本研究中,我们通过强化学习技术结合其他机器学习技术(即 FIVE-ML 项目)介绍了从基于规则的行为到基于学习的自适应行为的转变研究。为了实现这一目标,主要针对空对空和空对地场景训练基于强化学习的行为模型,最多可训练六个虚拟实体。观察发现,使用强化学习训练的虚拟实体优于现有的基于规则的行为模型。在这些实验中,还观察到,在强化学习之前利用监督学习作为起点可显著缩短训练时间并创建更逼真的行为模型。
16. 摘要:为本合同制作模型和原型软件付出了巨大努力。本最终报告的目的不是重复以前报告中提供的有关这些和其他主题的信息。目的是总结该项目的重要方面,并完成以前报告中未彻底涵盖的模型和软件原型描述。本合同的最终报告将总结以下内容:• 行为模型的描述;• 为补充模型所需研究而进行的四项研究;• 如何对文献中的任务进行建模并将其包含在原型软件中;• 原型软件及其一些主要模块;• 后续步骤的建议;• 为该项目撰写的每份先前报告的标题和简要摘要。
摘要本文提出了一种基于遗传编程(GP)的新方法,以得出描述电池末端电压的瞬时演化的行为模型。这些模型在分析上将电池电压与其充电状态,充电/放电率和温度联系起来。与流行的基于等效电路的模型相比,主要优点之一是显着减少了生产识别模型参数所需的实验数据集的努力。GP生成了一个最佳的“候选”分析模型的家族,每个家族都与量化诸如简单性和准确性之类的性能指标的合适指标相关联。考虑到在现实的工作条件下,该方法用于描述磷酸锂(LifePO4或LFP)电池的短暂放电阶段,考虑到付费量在20%至80%之间,排放率在0.25C和1C之间,以及在5°C到35°C的范围内的温度之间的排放率在5°C到35°C的范围内可以提供不同的解决方案。选择两个模型并根据实验结果进行验证。所选模型在分析范围内保证了相对均方根误差(分别为0.31%和0.22%)的相对均方根误差(分别为0.31%和0.22%)。
摘要使用不同平台和数字零售环境中的接触点增加流量的需求不能过分强调。通常在转换优化中通常使用的一些常规状态无法捕获客户在与互联网商店交往时所做的复杂和动态路径。为了在转换漏斗中捕获客户的这种动态行为,本文介绍了一种基于神经网络的新方法。此外,通过使用人工神经网络(ANN)进行机器学习过程,该模型对客户活动进行了实时预测,并为零售商揭示了适当的关键时刻,以影响客户的决策过程以优化客户体验。这些发现表明,神经网络模型的应用提高了客户行为表示的准确性,以提供提高销售生产率的最佳转换策略。
摘要在这项工作中,我们提出了一种方法,将在上一篇论文中与Python开发的行为模型与动态热模拟软件Energation Plus(研究和设计中使用的高级代码)一起开发的行为模型。提出的耦合方法应用于聚会岛的潮湿热带气候中的办公楼的热模型,并通过测量的温度和相对湿度数据进行校准和验证。然后,将此产生的耦合模型与典型的设计办公室能量模型进行了比较,该模型基于典型的确定性场景。比较着重于所使用的吊扇的功率水平,开放使用水平和计算时间。通过与新行为模型耦合获得的结果比在常规确定性方案中更好,在设计阶段提供了对用户行动的更忠实地复制。
开发新的运动补偿 T1 映射方法,该方法使用 MR 信号行为模型进行图像重建,以在尽可能短的采集时间内实现准确的 T1 量化