近年来,机器学习技术在微型游泳机器人开发中的应用引起了广泛关注。特别是强化学习已被证明可以帮助游泳机器人通过与周围环境的互动学习有效的推进策略。在本研究中,我们应用强化学习方法来识别多连杆模型游泳机器人的游泳步态。该游泳机器人由多个刚性连杆通过铰链串联而成,铰链可以自由旋转以改变相邻连杆之间的相对角度。Purcell [“低雷诺数下的生命”,Am. J. Phys. 45, 3 (1977)] 展示了三连杆游泳机器人(现称为 Purcell 游泳机器人)如何在没有惯性的情况下执行规定的铰链旋转序列以产生自我推进力。在这里,我们不依赖任何低雷诺数运动的先验知识,首先展示了如何使用强化学习来识别 Purcell 游泳机器人在三连杆情况下的经典游泳步态。接下来,我们将研究随着连杆数量的增加,学习过程中习得的新游泳步态。我们还考虑了一次只允许单个铰链旋转以及允许多个铰链同时旋转的场景。我们对比了游泳者在这些场景下学习到的运动步态的差异,并讨论了它们的推进性能。总而言之,我们的结果证明了如何应用简单的强化学习技术来识别低雷诺数下的经典游泳步态和新型游泳步态。
主要关键词