摘要 - 虽然自动驾驶的能力已迅速发展,但融合到密集的交通仍然是一个重大挑战,但已经提出了许多针对这种情况的运动计划方法,但很难对其进行评估。大多数现有的闭环模拟器依赖于其他车辆的基于规则的控件,这导致缺乏多样性和随机性,因此无法准确评估高度交互式场景中的运动计划能力。此外,传统的评估指标不足以全面地评估密集流量合并的性能。回应,我们提出了一个闭环评估基准,用于评估合并方案的运动计划功能。我们的方法涉及在大规模数据集中训练的其他车辆,具有微观行为特征,可显着提高复杂性和多样性。此外,我们通过利用大型语言模型来评估每种自动驾驶汽车合并到主要道路上来重组评估机制。广泛的实验证明了该评估基准的高级性质。通过此基准,我们获得了对存在方法的评估并确定了常见问题。我们设计的环境和车辆运动计划模型可以通过https://anonymon.4open.science/r/ bench4merge-eb5d访问。
摘要 - 常规任务和运动计划(TAMP)方法依赖于手动设计的界面将符号任务计划与连续运动的连接连接。这些特定领域和劳动密集型模块在解决现实世界中的新兴任务方面受到限制。在这里,我们提出了LLM 3,这是一种新型的大型语言模型(LLM)的tamp框架,具有独立于域的界面。具体来说,我们利用了预训练的LLM的强大推理和计划能力提出符号动作序列,并为运动计划选择连续的动作参数。至关重要的是,LLM 3通过提示结合了运动计划,允许LLM通过推理运动故障来迭代地完善其建议。因此,LLM 3在任务计划和运动计划之间的接口,减轻了处理域之间特定信息的复杂设计过程。通过盒装域中的一系列模拟,我们定量地证明了LLM 3在解决tamp问题和选择动作参数方面的效率。消融研究不解决运动失败推理对LLM 3的成功的显着贡献。此外,我们在物理操纵器上进行定性实验,证明了我们在现实世界中方法的实际适用性。
抽象的蛇机器人由于其特殊的身体和步态而变得富裕。但是,由于其复杂的模型,很难计划在多孔环境中进行运动。为了解决这个问题,这项工作研究了一种基于学习的运动计划方法。为可行的路径计划,并提出了一种修改的深Q学习算法,提出了一种弗洛伊德移动的平均算法,以确保蛇机器人通过的路径的平稳性和适应性。一种改进的路径积分算法用于解决步态参数以控制蛇机器人以沿计划的路径移动。为加快参数的训练,设计了一种结合串行训练,并行培训和经验重播模块的策略。此外,我们设计了一个运动计划框架,包括路径计划,路径平滑和运动计划。进行了各种模拟,以验证所提出的算法的效果。
本杰明·塔姆(Benjamin Tam),博士,澳大利亚昆士兰州大学自治机器人的自适应行为选择,2023年3月。Adam Pettinger博士,使用负担能力原始人来增强德克萨斯大学奥斯汀分校的机器人操纵任务自治和执行,2023年3月。Jeroen de Maeyer博士,受约束的最终效果路径下面:基于抽样的计划算法和基准测试框架,Ku Leuven,2021年11月。Andrew Short,博士,基于抽样的运动计划与联系人,沃隆隆大学,2020年6月。 Bryce Willey,MS,在2018年8月莱斯大学合并了机器人路径计划中的采样和优化。 Zachary Kingston,MS,一个基于限制抽样计划的统一框架,莱斯大学,2017年11月。 戴夫·科尔曼(Dave Coleman),博士,改善使用经验的运动计划的方法,科罗拉多大学博尔德大学,2016年12月。 Stephen Butler,MS,《时间 - 最佳轨迹生成问题》的一般算法,莱斯大学,2016年11月。。 Ryan Luna,博士,在复杂领域的机器人运动计划中结合了离散和连续的推理,莱斯大学,2016年5月。。 Devin Grady,博士,运动计划,与机器人任务中的不确定信息,莱斯大学,2013年12月。。Andrew Short,博士,基于抽样的运动计划与联系人,沃隆隆大学,2020年6月。Bryce Willey,MS,在2018年8月莱斯大学合并了机器人路径计划中的采样和优化。Zachary Kingston,MS,一个基于限制抽样计划的统一框架,莱斯大学,2017年11月。戴夫·科尔曼(Dave Coleman),博士,改善使用经验的运动计划的方法,科罗拉多大学博尔德大学,2016年12月。Stephen Butler,MS,《时间 - 最佳轨迹生成问题》的一般算法,莱斯大学,2016年11月。Ryan Luna,博士,在复杂领域的机器人运动计划中结合了离散和连续的推理,莱斯大学,2016年5月。Devin Grady,博士,运动计划,与机器人任务中的不确定信息,莱斯大学,2013年12月。
功能性神经影像学表明,在各种运动和认知任务中,背侧额叶区域表现出联合活动。但是,尚不清楚这些区域是否服务于多种计算独立的功能,或者是重复使用以服务高阶功能的电动机“核心过程”的基础。我们假设心理旋转能力取决于植根于这些区域内的系统发育较旧的运动过程。这一假设需要在运动计划期间招募的神经和认知资源预测看似无关的心理旋转任务的表现。为了检验这一假设,我们首先通过测量了30名健康参与者的内部触发的与外部触发的手指按压,从而确定了与运动计划相关的大脑区域。内部触发的手指压机在顶,前和枕颞区域产生了显着的激活。然后,我们要求参与者在扫描仪外执行两项心理旋转任务,包括手或字母作为刺激。顶点和前运动激活是涉及手的心理旋转时个体反应时间的重要预测指标。我们发现运动计划与字母心理旋转的性能之间没有关联。我们的结果表明,在运动计划期间招募的顶叶和前皮层的神经资源也有助于身体刺激的心理旋转,这表明这两个能力的基础是共同的核心成分。
摘要 - 用于运动计划的运动计划(RL)在慢训练速度和差异性差方面仍然具有低效率和差异性。在本文中,我们提出了一种新型的基于RL的机器人运动计划框架,该框架使用隐式行为克隆(IBC)和动态运动原始(DMP)来提高训练速度和外部RL试剂的概括性。IBC利用人类演示数据来利用RL的训练速度,而DMP则是一种启发式模型,将运动计划转移到更简单的计划空间。为了支持这一点,我们还使用可用于类似研究的选择实验创建了人类的示范数据集。比较研究揭示了所提出的方法比传统RL药剂的优势,训练速度更快,得分更高。实体实验实验指示了所提出的方法对简单组装任务的适用性。我们的工作提供了一种新的观点,即使用运动原语和人类演示来利用RL的性能用于机器人应用。
1。J. Ho,A。Jain和P. Abbeel。 剥离扩散概率模型。 2020-12- doi:10.48550/arxiv.2006.11239 2。 A. Nichol和P. Dhariwal。 改进了扩散概率模型。 2021-02-18。 doi:10.48550/arxiv.2102.09672 3。 Jänner,M.,Du,Y.,Tenenbaum,J. B.和Levine,S。(2022)。 计划扩散,以进行柔性链球合成。 Arxiv(康奈尔大学)。 doi:10.48550/arxiv.2205.09991 4。 Carvalho,J。F.,Le,A。T.,Baierl,M.,Koert,D。,&Peters,J。 (2023)。 运动计划扩散:通过扩散模型对机器人运动的学习和计划。 Arxiv(康奈尔大学)。 doi:10.48550/arxiv.2308.01557 5。 S. M. Lavalle,计划算法,2006年,剑桥出版社6。 Mark Moll,Ioan A. ucan,Lydia E. Kavraki,基准运动计划算法:一种可扩展的分析和可视化基础架构,IEEE Robotics&Automation Magazine,22(3):96-102:96-102,2015年9月。J. Ho,A。Jain和P. Abbeel。剥离扩散概率模型。2020-12- doi:10.48550/arxiv.2006.11239 2。A. Nichol和P. Dhariwal。改进了扩散概率模型。2021-02-18。 doi:10.48550/arxiv.2102.09672 3。Jänner,M.,Du,Y.,Tenenbaum,J. B.和Levine,S。(2022)。 计划扩散,以进行柔性链球合成。 Arxiv(康奈尔大学)。 doi:10.48550/arxiv.2205.09991 4。 Carvalho,J。F.,Le,A。T.,Baierl,M.,Koert,D。,&Peters,J。 (2023)。 运动计划扩散:通过扩散模型对机器人运动的学习和计划。 Arxiv(康奈尔大学)。 doi:10.48550/arxiv.2308.01557 5。 S. M. Lavalle,计划算法,2006年,剑桥出版社6。 Mark Moll,Ioan A. ucan,Lydia E. Kavraki,基准运动计划算法:一种可扩展的分析和可视化基础架构,IEEE Robotics&Automation Magazine,22(3):96-102:96-102,2015年9月。Jänner,M.,Du,Y.,Tenenbaum,J.B.和Levine,S。(2022)。计划扩散,以进行柔性链球合成。Arxiv(康奈尔大学)。doi:10.48550/arxiv.2205.09991 4。Carvalho,J。F.,Le,A。T.,Baierl,M.,Koert,D。,&Peters,J。(2023)。运动计划扩散:通过扩散模型对机器人运动的学习和计划。Arxiv(康奈尔大学)。doi:10.48550/arxiv.2308.01557 5。S. M. Lavalle,计划算法,2006年,剑桥出版社6。Mark Moll,Ioan A. ucan,Lydia E. Kavraki,基准运动计划算法:一种可扩展的分析和可视化基础架构,IEEE Robotics&Automation Magazine,22(3):96-102:96-102,2015年9月。
准确地对重型车辆(例如卡车)的动态进行建模对于安全自动导航至关重要。动态模型需要在各种天气和道路状况以及不同的负载配置下捕获复杂的系统行为。此摘要概述了在自动驾驶汽车的运动计划和控制背景下,物理知识的长期记忆(PI-LSTM)网络的整合为动态模型。通过利用LSTM的预测能力来建模复杂的动力学,并通过在损失函数中添加物理约束而施加的普遍性,我们为生成针对运动计划和控制而定制的更有效和可靠的预测的框架。车辆建模的系统识别问题旨在解决以下普通微分方程:
摘要 - 动态环境中的动作计划是自动机器人技术的重要任务。新兴方法采用可以通过观察(例如人类)专家来学习的神经网络。此类运动计划者通过不断提出候选路径以实现目标来对环境做出反应。这些候选路径中的一些可能是不安全的,即导致碰撞。因此,必须使用碰撞检测检查提议的路径以确保安全。我们观察到,如果我们可以预期哪些查询将返回不安全的结果,则可以消除25% - 41%的碰撞检测查询。我们利用这一观察结果提出了一种机制坐标,以预测沿拟议路径的给定机器人位置(姿势)是否会导致碰撞。通过优先考虑对预测碰撞的详细评估,坐标可以快速消除神经网络和其他基于采样的运动计划者提出的无效路径。坐标通过利用不同机器人姿势的物理空间位置并使用简单的哈希和饱和计数器来实现这一目标。我们证明了在包括CPU,GPU和ASIC在内的不同计算平台上碰撞预测的潜力。我们进一步提出了一个硬件碰撞预测单元(COPU),并将其与现有的碰撞检测加速器集成在一起。这平均17。2% - 32。跨不同运动计划算法和机器人的碰撞检测查询数量减少了1%。当应用于最先进的神经运动计划者[41]时,坐标会提高性能/瓦特1。平均而言,针对不同难度水平的运动计划查询。此外,我们发现碰撞预测的好处随着运动计划查询的计算复杂性增加并提供1。30×在狭窄的段落和混乱的环境中进行性能/瓦特的迹象。索引术语 - 机器人,硬件加速度,运动计划,碰撞检测,碰撞预测