策略摘要是一种计算范式,用于向人类解释自治机器人的行为和决策过程。它通过示例性的演示总结了机器人政策,旨在提高人类对机器人行为的理解。这种理解至关重要,尤其是因为用户经常对现实世界中的机器人部署做出批评。政策摘要中先前的研究主要集中在模拟机器人和环境上,忽略了其在物理体现的机器人中的应用。我们的工作通过将当前的策略摘要方法与涉及与机器人进行物理互动的新颖的交互式用户界面相结合,从而填补了这一空白。我们进行人类受试者实验来评估我们的解释系统,重点是不同解释方式在政策摘要中的影响。我们的发现强调了将虚拟和体育锻炼环境相结合以有效地将机器人行为传达给人类用户的独特优势。
控制人形和类动物机器人仍然是一个重大挑战。机器学习方法已经在模拟中表现良好。但模拟与现实之间的差异有时使得很难在真实机器人上获得同样好的结果。此外,学习算法需要大量的训练数据。这项工作的目的是构建一个沙箱,使模拟机器人和真实机器人能够进行比较,并支持受控和连续收集模拟和真实数据。沙箱由动作捕捉组件和模拟组件组成。动作捕捉组件负责数据收集。为此,使用了带有六个高精度红外摄像机的 OptiTrack 系统。仿真组件使用Simulink和Simscape Multibody Library实现,负责仿真数据与真实数据的探索和比较。这项工作使用了 ROBOTIS 的四足机器人,由 15 个 Dynamixel 伺服电机控制。为了将机器人集成到沙箱中,必须对其控制器进行重新编程。这简化了向机器人传输运动数据的过程,并使得远程控制机器人成为可能。然后为机器人提供反光标记及其运动
通过在光学晶格中实现强相关的费米模型来模拟高温超导材料,是模拟量子模拟领域的主要目标之一。在这里我们表明,局部控制和光学双层功能与空间分辨的测量相结合,创建了一种多功能工具箱,以研究镍和铜酸盐高温超导体的基本特性。一方面,我们提出了一种实施混合尺寸(混合)双层模型的方案,该模型已提议捕获加压双层镍的基本配对物理。这允许在当前晶格量子模拟机中长期实现具有远程超级传导顺序的状态。,我们展示了如何以部分粒子孔转换和旋转的基础访问连贯的配对相关性。另一方面,我们证明了对局部门的控制能够通过模拟具有有吸引力的相互作用的系统来观察D波配对顺序。最后,我们介绍了一种计划,以测量动量分辨的掺杂剂密度,从而提供了对固态实验互补的可观察物,这对于未来在丘比特中出现的神秘伪群阶段的研究特别感兴趣。
1.事实信息 ......................。。。。。。。。。。。。。。。。。。。。。。。。....1 1.1 飞行历史 .................。。。。。。。。。。。。。。。。。。。。。。。。..............1 1.2 人身伤害 ..........。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。6 1.3 飞机损坏。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。6 1.4 其他损坏。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。7 1.5 人员信息。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。7 1.5.1 船长 .。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。................7 1.5.1.1 飞行员和模拟机教练对机长的面试 ........。。。。。8 1.5.2 副驾驶 .。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。..........9 1.5.2.1 飞行员和模拟器教练对副驾驶的面试 ........10 1.6 飞机信息 ...。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。10 1.6.1 动力装置。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。11 1.6.2 系统。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。11 1.6.3 维护记录。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。13 1.7 气象信息。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。13 1.8 导航辅助设备。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。14 1.9 通讯。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。14 1.10 机场信息。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。14 1.10.1 空中交通管制。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。14 1.11 飞行记录仪。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。16 1.11.1 驾驶舱录音机。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。16 1.11.2 飞行数据记录器。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。17 1.12 残骸和影响信息。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。17 1.12.1 发电厂.。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。18 1.12.2 系统。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。18 1.13 医疗和病理信息。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。19 1.14 火灾。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。19 1.15 生存方面。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。19 1.16 测试和研究。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。19 1.16.1 飞机性能研究。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。19 1.16.1.1 爬升到 41,000 英尺。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。19 1.16.1.2 空气动力失速和翻转事件。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。21 1.16.1.3 下降和滑翔性能。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。22 1.16.2 驾驶舱录音机研究。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。24 1.16.3 发动机测试。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。26 1.16.4 负载控制阀仿真研究。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。27 1.17 组织和管理信息。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。28 1.17.1 地面学校和模拟器训练。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。28
摘要 - 腿部机器人控制的最新进展是由无模型的强化学习驱动的,但我们探索了可区分模拟的潜力。不同的模拟有望更快地收敛和更稳定的训练,但是到目前为止,其用于腿部机器人控制的使用仍然限于模拟。可区分仿真的主要挑战在于由于接触良好的环境中的不连续性(例如四倍的运动)而导致机器人任务的复杂优化土地。这项工作提出了一个新的,可区分的模拟框架来克服这些挑战。关键思想涉及将复杂的全身仿真解耦,该模拟可能由于接触而表现出不连续性,分为两个单独的连续域。随后,我们将简化模型产生的机器人状态与更精确,不可差的模拟器对齐,以保持足够的模拟精度。我们的框架可以使用单个模拟机器人在几分钟内学习四足动物,而无需任何并行化。随着GPU并行化的增强,我们的方法允许四倍的机器人在挑战地形上掌握各种各样的机车技巧,包括小跑,步伐,绑定和gallop。此外,我们的政策在现实世界零击中实现了强大的运动性能。据我们所知,这项工作代表了使用可区分模拟控制真正四倍的机器人的首次演示。这项工作提供了一些重要的见解,以便在现实世界中使用可区分的模拟进行腿部运动。