Loading...
机构名称:
¥ 1.0

摘要 - 我提出了一种新颖的增强学习方法,用于在模拟环境中训练四足机器人。在动态环境中控制四足机器人的想法非常具有挑战性,我的方法提出了最佳的政策和培训方案,资源有限,并且表现出色。该报告使用RaisimgyMtorch开源库和专有软件Raisim进行模拟Anymal机器人。我的方法以训练时的机器人步行方案的评估为中心,以制定马尔可夫决策过程。使用在Actor-Critic模式下使用的近端策略优化算法来解决结果的MDP,并使用一台台式机收集了数千个状态转换。这项工作还提出了一个控制器方案,该计划在模拟环境中显示了数千个时间步骤。这项工作还为早期研究人员提供了他们喜欢的算法和配置的基础。

使用深钢筋的四倍的机器人模拟...

使用深钢筋的四倍的机器人模拟...PDF文件第1页

使用深钢筋的四倍的机器人模拟...PDF文件第2页

使用深钢筋的四倍的机器人模拟...PDF文件第3页

使用深钢筋的四倍的机器人模拟...PDF文件第4页

使用深钢筋的四倍的机器人模拟...PDF文件第5页

相关文件推荐

2024 年
¥1.0
2024 年
¥8.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥2.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2023 年
¥1.0
2024 年
¥2.0
1900 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2025 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
1900 年
¥1.0
2024 年
¥1.0
2024 年
¥1.0
2024 年
¥5.0