摘要 - 我提出了一种新颖的增强学习方法,用于在模拟环境中训练四足机器人。在动态环境中控制四足机器人的想法非常具有挑战性,我的方法提出了最佳的政策和培训方案,资源有限,并且表现出色。该报告使用RaisimgyMtorch开源库和专有软件Raisim进行模拟Anymal机器人。我的方法以训练时的机器人步行方案的评估为中心,以制定马尔可夫决策过程。使用在Actor-Critic模式下使用的近端策略优化算法来解决结果的MDP,并使用一台台式机收集了数千个状态转换。这项工作还提出了一个控制器方案,该计划在模拟环境中显示了数千个时间步骤。这项工作还为早期研究人员提供了他们喜欢的算法和配置的基础。
重新评估期中考试:学生将在考试期间访问他们的期中考试。担心如何在中期考试中有特定问题的学生可以在接受标记考试之日的两个星期内通过电子邮件向教练提交请求。请求应指定要重新评估哪个问题,(2)该请求的基本原理,以及(3)提出的标记。重要的是,一旦提交了重新评估请求,就可以根据教师的酌处权来调整标记。不允许学生与他们一起参加期中考试,也不可以为他们拍照,因此,如果令人担忧,建议学生在考试期间做笔记。TA无权在中期考试中进行权衡,这是教练只能做的事情。一旦重新评估问题,也可以注意标记。
本文提出了一套新的缩放定律,用于研究轻质钢筋混凝土隧道衬砌在 1g 振动台试验中的开裂后行为。开裂后行为缩放定律使用两个无量纲参数制定:脆性数 s ,它控制非钢筋混凝土构件的断裂现象;NP ,它对钢筋混凝土构件中混凝土断裂过程和钢塑性流动的稳定性起主要作用。提出的定律允许开发“充分”的实验模型,并使用原型和 1:30 模型比例的岩石钢筋隧道的数值分析进行验证。采用的实验装置的灵感来自现有的 1g 物理测试活动,该测试活动针对岩石混凝土隧道的地震响应,并且假设的定律表明在两个检查的地震记录下,模型和原型隧道的开裂行为具有令人满意的相似性。强调了在 1g 测试中使用提出的定律对钢筋混凝土隧道中不断发展的裂缝模式进行 A 级预测的潜力。在三种可能的边界条件下对所提出的定律进行了检验,结果表明,与设想的自由场边界模型相比,刚性箱和层流箱仍然可以显著改变行为。但分析表明,对于较大的土壤与衬砌刚度比,边界伪影可以大大减少。本研究为迄今为止尚不存在的未来 1g 测试提供了有用的建议,而所提出的缩放定律允许在设计新型隧道衬砌模型测试材料时具有多功能性。