机器人表网球中的样品效率增强学习*__

机器人表网球中的样品效率增强学习*

可下载资源数量

已经购买

下载数量：1

单价	0 1.0
Coupon	100% 0%
Total	0 1.0

点击下载点击购买并下载

点击购买，资源将自动在新窗口打开.

机构名称：

机器人表网球中的样品效率增强学习*

¥ 1.0

热度

摘要 - 强化学习（RL）在各种计算机游戏和模拟中取得了一些令人印象深刻的成功。大多数这些成功都是基于代理可以从中学习的大量情节。在典型的机器人应用中，可行尝试的数量非常有限。在本文中，我们提出了一种应用于乒乓球机器人示例的样品效率RL算法。在乒乓球中，每个中风都有不同的位置，速度和旋转。因此，必须在高维连续状态空间上找到准确的回报。在几个试验中进行学习，该方法嵌入了我们的机器人系统中。通过这种方式，我们可以使用一个步骤的环境。状态空间在击球时间（位置，速度，旋转）时取决于球，而动作是击球时的球拍状态（方向，速度）。开发了一种基于参与者的确定性策略梯度算法，用于加速学习。我们的方法在模拟和在许多具有挑战性的场景中都具有竞争力。在200次培训发作中，无需预先培训即可获得准确的结果。呈现我们实验的视频可在https://youtu.be/uratdol6wpw上获得。

添加pdf代下载 VIP点击下载文件

机器人表网球中的样品效率增强学习*

主要关键词

机器人计算机学习的典型的尝试的击球梯度不同的应用乒乓球速度参与者竞争力梯度算法状态空间算法实验的模拟准确的 RL 培训具有学习连续状态

机器人表网球中的样品效率增强学习*PDF文件第1页

机器人表网球中的样品效率增强学习*PDF文件第2页

机器人表网球中的样品效率增强学习*PDF文件第3页

机器人表网球中的样品效率增强学习*PDF文件第4页

机器人表网球中的样品效率增强学习*PDF文件第5页

可下载资源数量

已经购买

下载数量：1

机器人表网球中的样品效率增强学习*

机器人表网球中的样品效率增强学习*

相关文件推荐

与人类合作的机器人的多模式增强学习

增强学习

增强学习

增强学习驱动的多臂机器人的控制...

增强学习

机器人学习

通过增强学习

增强学习

增强学习

增强学习

二元增强学习

通过增强学习

增强学习

逆增强学习

增强学习基于复杂环境中蛇机器人的运动控制

动态联盟形成和多机器人任务分配的路由通过增强学习

静态摩擦对机器人增强学习中SIM2REAL的影响

在线多机器人覆盖路径在动态环境中通过信息素的增强学习

样本效率强大的多代理增强学习...

逆增强算法学习

增强学习是您需要的

微调中的增强学习价值

开放式学习机器人的目的

了解逆增强学习

suppodular增强学习

学习为增强学习优化

控制系统和增强学习

M2Curl：通过自我监督的表示机器人操纵学习的样品有效的多模式增强学习

增强学习（E061360）

增强学习（MIE1630）

XiaoMi-AI