摘要:本文研究了人工智能在Gazebo模型上实现深度确定性策略梯度(DDPG)以及现实移动机器人的应用。实验研究的目标是引导移动机器人在面对固定和移动障碍物时,学习在现实环境中移动的最佳动作。当机器人在有障碍物的环境中移动时,机器人会自动控制避开这些障碍物。然后,在特定限制内维持的时间越长,积累的奖励就越多,因此会取得更好的结果。作者对许多变换参数进行了各种测试,证明了DDPG算法比Q学习、机器学习、深度Q网络等算法更有效。然后执行SLAM来识别机器人位置,并在Rviz中精确构建和显示虚拟地图。研究结果将成为设计和构建移动机器人和工业机器人控制算法的基础,应用于编程技术和工业工厂自动化控制。索引词——移动机器人、人工智能、DDPG 算法、自主导航、强化学习。
主要关键词