摘要 - 我提出了一种新颖的增强学习方法,用于在模拟环境中训练四足机器人。在动态环境中控制四足机器人的想法非常具有挑战性,我的方法提出了最佳的政策和培训方案,资源有限,并且表现出色。该报告使用RaisimgyMtorch开源库和专有软件Raisim进行模拟Anymal机器人。我的方法以训练时的机器人步行方案的评估为中心,以制定马尔可夫决策过程。使用在Actor-Critic模式下使用的近端策略优化算法来解决结果的MDP,并使用一台台式机收集了数千个状态转换。这项工作还提出了一个控制器方案,该计划在模拟环境中显示了数千个时间步骤。这项工作还为早期研究人员提供了他们喜欢的算法和配置的基础。
本文介绍了GenH2R,这是一个学习基于远见的人类到机器人(H2R)han-dover技能的框架。目标是为机器人配备能够以各种复杂轨迹的人类传递的几何形状可靠接收对象。我们通过通过全面的解决方案进行大规模学习H2R移交,包括程序模拟资产创建,自动演示式概述和有效的模仿学习。我们利用大型3D模型存储库,敏感的GRASP生成方法和基于曲线的3D动画来创建名为GenH2R-SIM的H2R交换模拟环境,并通过三个尺度级传递了现有模拟器中现有模拟器中的场景数量。我们进一步引入了一种蒸馏友好的演示生成方法,该方法自动产生了一百万个适合学习的高质量演示。最后,我们提出了一种4D模仿的学习方法,该方法通过将来的预测目标增强,以将示范示例提炼为视觉运动切换政策。在所有情况下,模拟器和现实世界中的实验评估都表现出比基线的显着提高(至少 +10%的成功率)。
摘要:镍基高温合金具有优异的耐腐蚀和耐高温性能,在能源和航空航天工业中广受欢迎。镍合金的直接金属沉积 (DMD) 已达到技术成熟度,可用于多种应用,尤其是涡轮机械部件的修复。然而,DMD 工艺过程中的零件质量和缺陷形成问题仍然存在。激光重熔可以有效地预防和修复金属增材制造 (AM) 过程中的缺陷;然而,很少有研究关注这方面的数值建模和实验工艺参数优化。因此,本研究的目的是通过数值模拟和实验分析来研究确定重熔工艺参数的效果,以优化 DMD 零件修复的工业工艺链。热传导模型分析了 360 种不同的工艺条件,并将预测的熔体几何形状与流体流动模型和选定参考条件下的实验单轨观测值进行了比较。随后,将重熔工艺应用于演示修复案例。结果表明,模型可以很好地预测熔池形状,优化的重熔工艺提高了基体和 DMD 材料之间的结合质量。因此,DMD 部件制造和修复工艺可以从此处开发的重熔步骤中受益。
模拟在粒子和核物理学中起重要作用。它被广泛用于DECOTER设计和实验数据和理论模型之间的比较。在特定上,模拟依赖于蒙特卡洛方法,需要显着的计算资源。尤其是,这种方法不能扩展以满足高光度大型强子对撞机(HL-LHC)运行期间预期的大量数据所产生的增长需求。使用众所周知的仿真软件Geant4捕获的粒子碰撞和相互作用的详细模拟需要数十亿个CPU小时,构成了LHC实验的一半以上的计算源[1,2]。更具体地说,对热量表中粒子阵雨的详细模拟是计算最高的步骤。已经开发了利用重复使用先前计算或测量物理量的思想的模拟方法,以减少计算时间[3,4]。这些方法从专门进行到单独的实验中,尽管它们比完整的模拟更快,但它们的速度不够快或缺乏准确性。因此,粒子物理社区需要使用新的更快的模拟方法来建模实验。模拟热量计响应的可能方法之一是使用深度学习技术。,特别是最近的工作[5]提供了证据,表明可以使用生成性副本网络来效果模拟粒子阵雨。虽然实现了超过100 000倍的速度,但设置非常简单,因为输入粒子为
Terms of use This article was downloaded from Harvard University's DASH repository, and is made available under the terms and conditions applicable to Open Access Policy Articles (OAP), as set forth at https://harvardwiki.atlassian.net/wiki/external/NGY5NDE4ZjgzNTc5NDQzMGIzZWZhMGFlOWI2M2EwYTg
摘要:我们表明,通过扩展主动推理框架,可以在目的论框架中制定目标导向的行动规划和生成。所提出的模型建立在变分递归神经网络模型上,具有三个基本特征。这些特征是:(1)可以为静态感官状态(例如要达到的目标图像)和动态过程(例如围绕物体移动)指定目标;(2)该模型不仅可以生成目标导向的行动计划,还可以通过感官观察来理解目标;(3)该模型根据从过去的感官观察推断出的当前状态的最佳估计,为给定目标生成未来的行动计划。通过在模拟移动代理以及执行对象操作的真实人形机器人上进行实验来评估所提出的模型。
摘要 本文介绍的发动机监控和控制系统 (E-MACS) 显示器是一种概念验证产品,其设计理念侧重于提供比传统设计的显示器更直接面向用户任务的信息。E-MACS 显示器是一种全新的发动机仪表显示器概念,其目的是为飞行员提供一种增强的方法来控制和监控发动机性能。它以图形方式提供有关性能能力、当前性能以及相对于标称条件的发动机组件或子系统运行条件的信息。该概念是根据传统的、最先进的电子发动机显示格式进行评估的。16 名飞行员参加了此次评估。评估结果显示,与传统显示器相比,飞行员非常喜欢 E-MACS 显示器。评估的故障检测部分(通常称为“操作员错误”)的结果显示,E-MACS 显示器的检测率为 100%,而传统显示器的检测率为 57%。从这些结果可以得出结论,通过在驾驶舱中提供此类信息,可以减少飞行员的工作量并增强检测退化或非正常情况的能力,从而提高操作安全性。