多智能体轨迹预测是一项基础任务,可应用于自动驾驶、物理系统建模和智慧城市等各个领域。该任务具有挑战性,因为智能体交互和底层连续动力学共同影响其行为。现有方法通常依赖图神经网络 (GNN) 或 Transformer 来提取智能体交互特征。然而,它们往往忽略了智能体之间的距离和速度信息如何动态地影响它们的交互。此外,以前的方法使用 RNN 或一阶常微分方程 (ODE) 来模拟时间动态,这可能缺乏对每个智能体如何受交互驱动的解释性。为了应对这些挑战,本文提出了 Agent Graph ODE,这是一种显式模拟智能体交互和连续二阶动力学的新方法。我们的方法采用变分自编码器架构,在编码器模块中结合了具有距离信息的时空Transformer和动态交互图的构建。在解码器模块中,我们采用具有距离信息的GNN来建模智能体交互,并使用耦合的二阶微分方程(ODE)来捕捉底层的连续动力学,该微分方程通过建模加速度和智能体交互之间的关系来构建模型。实验结果表明,我们提出的Agent Graph ODE在预测精度方面优于最先进的方法。此外,我们的方法在训练数据集中未见的突发情况下也表现良好。
摘要 - 自动驾驶的基本任务之一是安全的轨迹计划,决定车辆需要驾驶的任务,同时避免障碍,遵守安全规则并尊重道路的基本限制。这种方法的实际应用涉及考虑周围环境条件和运动,例如车道变化,避免碰撞和车道合并。本文的主要重点是使用高阶多项式来开发和实施安全碰撞的高速公路车道变化轨迹,以高度自动化驾驶功能(HADF)。规划通常被认为是比对照更高的级别过程。行为计划模块(BPM)的设计旨在计划高级驾驶动作(例如Lane Change Maneuver),以安全地实现横向指导的功能,以确保车辆安全性和通过环境有效的运动计划。基于从(BPM)收到的建议,该函数将产生一个相应的轨迹。所提出的计划系统是特有的,具有基于多项式的算法的情况,对于两个车道高速公路方案。多项式曲线具有连续曲率和简单性的优点,可降低整体复杂性,从而可以快速计算。通过MATLAB模拟环境对所提出的设计进行了验证和分析。结果表明,本文提出的方法在车道变化动作的安全性和稳定性方面取得了显着提高。索引项 - BPM,HADF,MPC,车道变更,轨迹产生。
根据给定序列预测人体运动是计算机视觉和机器学习中一项具有挑战性且至关重要的任务,它使机器能够有效地理解人类行为。精确预测人体姿势和运动轨迹对于各种应用都具有重要意义,包括自动驾驶、机器人技术和虚拟现实。本文提出了一种新方法来解决估计以 3D 姿势或 2D 轨迹表示的人体运动,以及使用 2D 图像和人体姿势/位置序列联合预测未来运动的相互关联的任务。我们提出了一种编码器-解码器架构,该架构利用具有自注意机制的 Transformer 网络,利用视觉上下文特征,结合 LSTM 来建模人体运动运动学。我们的方法在数量和质量上都比现有方法表现出持续显著的改进。在各种公共数据集上进行的大量实验,例如用于 3D 人体姿势估计的 GTA-IM 和 PROX,以及用于 2D 轨迹预测的 ETH 和 UCY 组合数据集,表明与当前最先进的方法相比,我们的方法大大减少了预测误差。
通过监督学习(RVS)进行的加强学习被称为离线增强学习(RL)的新兴范式。虽然返回条件的RVS(RVS-R)在与离线RL任务有关的广泛数据集中占主导地位,但最近的发现表明,目标条件条件的RVS(RVS-G)优于特定的子最好数据集中的轨迹迹象,其中轨迹插入轨迹可用于实现最新功能性能。但是,这种优势的根本原因仍未得到充分探索。在本文中,采用了教学实验和理论分析,我们揭示了RVS-G在缝线轨迹中的熟练程度源于其在评估过程中概括到未知目标方面的熟练性。在这种见解的基础上,我们引入了一种新颖的RVS-G方法,即空间组成RVS(SC-RVS),以增强其概括为未知目标的能力。此反过来又增强了子最佳数据集上的trajectory缝合性能。具体而言,通过利用优势重量的力量和最大透气正则重量,我们的方法可以与现有的RVS-G方法相比,在行动选择中促进乐观目标采样的促进与维护差异的悲观水平。对D4RL基准测试的广泛实验结果表明,在大多数情况下,我们的SC-RV对基准的表现良好,尤其是在需要轨迹缝线的亚最佳数据集上。
摘要:自动驾驶汽车和人类驾驶员之间的相互依赖性是自动驾驶安全性和可行性的一个开放问题。本文介绍了游戏理论轨迹计划者和混合人流环境的决策者。我们的解决方案是与周围车辆的相互作用,同时做出决策,并使用用衣架插值方法产生类似人类的轨迹。此处使用的粒子群优化器(PSO)桥梁桥接决策和轨迹生成过程,用于连接执行。我们选择了一个未信号的交叉点,以证明我们方法的可行性。测试结果表明,我们的方法降低了轨迹优化问题的搜索空间的维度,并在路径曲率上实施了几何约束。
从十世纪到十五世纪,意大利和托斯卡纳经济的强项在于人口稠密、物产丰富的乡村之间的共生关系、大型城市市场的邻近性,这些市场可以转售剩余产品并连接欧洲的主要贸易路线,以及城市内部和来自康塔多的移民生产的优质制成品在地区和国际市场上销售。1 随着人口摆脱农奴制并集中在村庄中,托斯卡纳乡村迅速变得高产。在十一世纪下半叶,比萨和卢卡周围的领土领主有限,阿尔诺河谷的统治较弱,马雷玛地区的统治较强。正是在这个时候,意大利的第一批公社沿着这条路线建立起来,垄断了领主权和税收。业主在镇上定居,镇民在土地上投资。他们都试图通过在城市市场上出售农业剩余产品来致富。为了实现这一目标,他们专注于种植更容易以更高价格出售的小麦,并以实物形式支付租金用于投机。从 12 世纪末开始,零散的地块被集中到更大的地块中;到下个世纪末,mezzadria 合同允许增加产量并定义劳动力,促进对收获转售的投机,并允许每五年调整一次合同条款。2
摘要 - 本文提出了一种用于抓住不规则对象的新轨迹重新启动器。与常规的掌握任务不同,该任务简单地假定对象的几何形状,我们旨在实现不规则对象的“动态掌握”,这需要在握把过程中持续调整。为了有效处理不规则的对象,我们提出了一个构成两个阶段的轨迹优化框架。首先,在指定的时间限制为10 s的指定时间限制中,为从机器人的初始配置中进行无缝运动计算初始离线轨迹,以掌握对象并将其传递到预定义的目标位置。其次,实现了快速的在线轨迹优化,以在100毫秒内实时更新机器人轨迹。这有助于减轻视力系统中的估计错误。为了解释模型的不准确性,干扰和其他非模块化效果,实施了机器人和抓手的轨迹跟踪控制器,以从提出的框架中阐明最佳轨迹。密集的实验结果有效地证明了我们在模拟和现实世界中的轨迹计划框架的性能。
摘要 - 在本文中,我们通过开发神经网络模型来大大扩展了机器人执行后续任务和该任务的变化的能力,从而从观察到的人类运动历史上预测未来的人类运动。我们提出了一个非自动回忆的变压器架构,以利用其并行性质,以便在测试时更容易训练和快速,准确的预测。所提出的结构将Human运动预测分为两个部分:1)人类轨迹,这是髋关节随时间的3D位置,以及2)人类姿势,这是所有其他关节在时间上相对于固定髋关节的3D位置。我们建议同时做出两个预测,因为共享表示可以改善模型性能。因此,该模型由两组编码器和解码器组成。首先,应用于编码器输出的多头注意模块改善了人类轨迹。第二,应用于与解码器输出相连的编码器输出的另一个多头自我发项模块有助于学习时间依赖性。我们的模型在测试准确性和速度方面非常适合机器人应用,并且相对于最先进的方法进行了比较。我们通过机器人后续任务证明了我们作品的现实适用性,这是我们提议的模型充满挑战而实用的案例研究。我们的模型预测的人类运动使机器人可以在情况下进行详细的人类运动,例如静止不动,即站立。它还使简单的控制策略能够琐碎地概括到人类关注的许多不同变化,例如后续行动。我们的代码和数据可在以下github页面上获得:https://github.com/mmahdavian/stpotr
记录的版本:此预印本的一个版本于2025年1月16日在自然通讯上发布。请参阅https://doi.org/10.1038/s41467-025-55830-0。
对随机和不规则抽样的时间序列进行建模是在广泛的应用中发现的一个具有挑战性的问题,尤其是在医学中。神经随机微分方程(神经SDE)是针对此问题的有吸引力的建模技术,它可以将SDE的漂移和扩散项与神经网络相关。但是,当前用于训练神经SDE的算法需要通过SDE动力学进行反向传播,从而极大地限制了它们的可扩展性和稳定性。为了解决这个问题,我们提出了轨迹流匹配(TFM),该轨迹以无模拟方式训练神经SDE,通过动力学绕过反向传播。TFM利用从生成建模到模型时间序列的流量匹配技术。在这项工作中,我们首先为TFM学习时间序列数据建立必要条件。接下来,我们提出了一个改善训练稳定性的重新聚集技巧。最后,我们将TFM适应了临床时间序列设置,从绝对性能和不确定性预测方面,在四个临床时间序列数据集上的性能提高了,这是在这种情况下的关键参数。