摘要:空中交通管制 (ATC) 是一项复杂且要求严格的工作,只有训练有素的专业人员才能胜任。培训 ATC 候选人具有挑战性,因为受训人员会受到教员的主观评估,而教员的工作方式会带有偏见。为了客观地确定控制专业知识,本研究对现有数据集采用了聚类技术,其中课程和专业管制员参与了中等保真度模拟实验。结果确定了一组八项指标,形成了两个独特而稳定的专业知识集群。随后的敏感性分析能够揭示每个课程参与者与专家集群的距离(或接近程度),以及这些参与者在哪些指标上偏离了专家。然而,在这个阶段,很难将这些结果转化为关于如何提高欠发达技能的具体建议。尽管这项探索性研究的样本量很小,结果的普遍性有限,但该方法似乎是确定描述 ATC 专业知识的客观因素的有希望的示范,值得进一步研究。
制造业的粮食生产对马来西亚经济的发展产生了重大贡献。因此,应强调食品制造的改善,以确保其持续增长。本研究着重于在食品制造系统中应用模拟模型和多标准数据包络分析(MCDEA)。对中小企业食品加工公司进行的案例研究进行了建模和分析,以改善系统的整体性能。在这项研究中,使用模拟实验和MCDEA来改善处理系统,并提出了一些改进模型。每个改进的仿真模型用于生成输入和输出,而MCDEA用于确定最有效的改进模型,以最大程度地减少等待时间。结果表明,与其他改进模型相比,IM7是最有效的模型。该模型建议将工人添加到包装过程中,并在打磨和包装过程中减少处理时间。所获得的方法和结果可以帮助工厂的管理做出更好的决策,并可以向其他中小型中小企业提供见解,以帮助提高其食品加工系统的绩效。
摘要。脑机接口是一种非侵入式设备,可获取大脑产生的信号,然后对其进行操纵以适应各种应用。BCI 的一个流行应用是与机器人接口;并且,每个 BCI - 机器人系统都采用不同的机器学习算法。本研究旨在对神经模糊算法(特别是自适应网络模糊推理系统 (ANFIS))进行性能分析,以对 Emotiv INSIGHT 检索到的 EEG 信号进行分类。还开发了一种 SVM 算法作为 ANFIS 性能的参考。研究人员可以使用一种生成和获取 EEG 信号的方法作为参考。面部和眼部手势被用作 EEG 信号生成的手段,并被输入到两种算法中进行模拟实验。结果表明,ANFIS 往往比 SVM 算法更可靠,并且略胜一筹。与 SVM 相比,ANFIS 占用了大量的计算资源,需要更高的规格和训练时间。
跨多个领域的系统的自主性水平正在提高,但这些系统仍然会遇到故障。降低故障风险的一种方法是整合对自主系统的人类监督,并在自主性失败时依靠人类进行控制。在这项工作中,我们制定了一种通过行动建议进行协作决策的方法,该方法可以在不控制系统的情况下改进行动选择。我们的方法通过结合通过建议共享的隐性信息来修改代理的信念,从而有效地利用每个建议,并且比单纯地遵循建议的操作以更少的建议实现更好的性能。我们假设协作代理具有相同的目标并通过有效的行动进行交流。通过假设建议的操作仅依赖于状态,我们可以将建议的操作作为对环境的独立观察。协作环境的假设使我们能够使用代理的策略来估计行动建议的分布。我们提出了两种使用建议行动的方法,并通过模拟实验演示了该方法。所提出的方法可以提高性能,同时也对次优建议具有鲁棒性。1
摘要:人形机器人由于其灵活性和类似人类的文化而在各种环境和任务中跨越人类具有巨大潜力。然而,鉴于高维动作空间和双足体系统的固有不稳定,全身控制仍然是一个重大挑战。以前的作品通常依赖于具有计算昂贵的优化的精确动态模型,也可以通过广泛的奖励调整进行特定于任务的培训。在这项工作中,我们介绍了Skillblender,这是一个层次的强化学习框架,首先使用预先设计的密集奖励开发了一系列原始技能,然后重新使用并融合了这些技能,以完成更复杂的新任务,需要最小的特定于任务的奖励工程。我们对两个复杂的机车操作任务进行的模拟实验表明,我们的方法显着胜过所有基础,同时自然地将行为正规化以避免奖励黑客攻击,从而导致更可行的人类样运动。网站:https://sites.google.com/view/wcbm-skillblender/。
摘要。随着大数据时代(BD)的出现,人们面临着大规模数据和复杂问题的挑战。这些数据并为决策者提供准确,及时的决策支持已成为当前研究中的热门问题。以营销决策为例,本文基于深度学习(DL)构建了BD分析和计算机辅助决策支持系统(DSS)。首先,系统通过数据预处理和功能提取提取与原始数据营销相关的功能。然后,DL模型用于学习和预测特征,并获得了营销策略的优化方案。最后,通过模拟实验测试了决策系统的实际应用效果,这证明了该方法的可行性和优势。通过采用DL模型,并比较模糊C聚集(FCM)算法和决策树(DT)算法,本文中的算法是稳定性测试中最稳定的算法,可以提供有效且稳定的决策支持。此外,本文中的算法在实时分析中也具有很大的优势,该算法可以快速处理大量数据并满足实时决策的需求。这些优势使基于DL的智能DSS具有广泛的应用前景,并且可以为实践决策问题提供强有力的支持。
决策是供应链中的核心问题。许多文献研究都根据客户的要求报告了各种决策技术。考虑到虚拟供应链市场中的高风险交易,信任是一个非常关键的要素,当客户尝试选择适当的供应商时,应被视为重要参考。最近,已经进行了一个伟大的问题,以根据信任和声誉制定决策。但是,这些研究工作仍在理论研究阶段。本文根据供应链中的信任和声誉提出并实施了多标准决策方法。首先,本文在实际供应链设置中定义了一般信任指标,并设计了多维信任和声誉模式。本文还引入了K-均值聚类算法以删除不公平的评分分数。然后,基于这种信任和声誉模型,我们提出了一种基于可变权重和满足原理的多标准决策方法。为了验证这种方法的性能,我们模拟了具有多代理平台的实用供应链设置。模拟实验表明,拟议的信任和声誉模型可以有效地对那些撒谎的客户进行不公平的评级
在 OMEGA 激光系统上进行的综合磁化衬套惯性聚变 (MagLIF) 实验旨在研究激光预热对内爆性能的影响。在模拟和实验中,用激光预热燃料都会提高中子产量,最大产量发生在最佳预热激光能量下。将预热能量增加到超过最佳值会降低中子产量。在模拟中,中子产量下降的速度取决于是否纳入能斯特效应。在 OMEGA 上的 MagLIF 预热阶段,能斯特效应会将磁场从燃料区域中心移出,并削弱磁通压缩。如果不包括能斯特效应,则模拟的超过最佳预热激光能量的产量下降将更加平缓,而不是实验中看到的急剧下降。模拟能够模拟实验中看到的测量离子温度的趋势。混合模型表明,在模拟燃料区域中加入来自壁面的混合会进一步降低产量并降低最佳预热激光能量。混合模拟预测,增加初始轴向磁场仍可能提高集成内爆的产量性能。
自主停车是一种革命性的技术,它随着深度强化学习的兴起,尤其是双胞胎延迟的深层确定性政策梯度算法(TD3),它改变了汽车行业。尽管如此,由于Q值估计的偏见,在确定在特定状态下采取的行动的良好时,TD3的鲁棒性仍然是一个重大挑战。为了研究这一差距,本文分析了TD3中的不同损失函数,以更好地近似真正的Q值,这对于最佳决策是必不可少的。评估了三个损失功能;平均平方错误(MSE),平均绝对误差(MAE)和HUBER损失,通过模拟实验进行自动停车。结果表明,HUBER损失的TD3具有最高的收敛速度,而最快的演员和批评损失收敛。发现Huber损失函数比孤立使用的MSE或MAE这样的损耗函数更强大,更有效,这使其成为TD3算法中现有损失函数的合适替代。将来,当估计的Q值代表以特定状态采取行动的预期奖励的估计Q值时,将使用Huber损失的TD3用作解决TD3中高估问题的基本模型。
乘车共享公司等双面市场通常涉及一组主题,这些主题在跨时间和/或政策中做出顺序决策。随着智能手机和物联网的快速发展,它们实质上改变了人类的运输格局。在本文中,我们考虑了乘车共享公司中的大规模车队管理,这些公司涉及随着时间的推移,在不同领域接收产品序列(或治疗)的多个单位。在这些研究中出现了主要的技术挑战,例如政策评估,是因为(i)空间和时间代理会引起位置和时间之间的干扰; (ii)大量位置导致维度的诅咒。为了同时解决这两个挑战,我们引入了在这些研究中进行政策评估的多代理强化学习(MARL)框架。,我们提出了新的估计量,以确保不同产品下的平均结果,尽管州行动空间的高度差异很高。在模拟实验中提出的估计量有益。我们使用从双面覆盖的公司获得的实际数据集进一步进一步,以评估应用不同的补贴策略的效果。我们提出的方法的Python实现可在https://github.com/runzhestat/causalmarl上获得。