摘要 - 该论文考虑了通过元强化学习的无人机(UAV)的轨迹设计问题。假定无人机可以在不同的方向上移动以探索特定区域并从该区域的地面节点(GNS)收集数据。无人机的目标是到达目的地,并最大程度地提高轨迹轨迹期间收集的总数据,同时避免与其他无人机发生碰撞。在有关无人机轨迹设计的文献中,香草学习算法通常用于训练特定于任务的模型,并为GNS的特定空间分布提供了近乎最佳的解决方案。但是,当GNS的位置变化时,此方法需要从头开始重新审查。在这项工作中,我们提出了一个元加强学习框架,该框架结合了模型 - 静态元学习方法(MAML)。而不是训练任务特定模型,我们为GNS和不同的通道条件的不同分布进行了共同的初始化训练。从初始化中,适应具有不同GN分布和通道条件的不同任务只需要几个梯度下降。此外,我们还探讨了何时优选提出的MAML框架,并且可以优于比较算法。
摘要。本文提出了一种新方法,以增强保形映射在地形跟随 (TF) 和地形规避 (TA) 飞行中最佳轨迹规划过程中的应用。新方法使用保形映射概念作为修饰工具,将由于存在障碍物而导致飞行高度受限的受限轨迹规划问题转换为没有障碍物和最小高度约束的再生问题。在这方面,利用 Schwarz-Christoel 定理将高度约束纳入飞机动态运动方程。然后通过数值方法(即直接 Legendre-Gauss-Radau 伪谱算法)求解再生的最优控制问题。优化了飞行时间、地形遮蔽和气动控制力的综合性能指标。此外,为了获得真实的轨迹,在求解算法中将飞机的最大爬升率和下降率作为不等式约束。二维飞行场景的几个案例研究表明该方法在 TF/TA 轨迹规划中的适用性。大量模拟证实了所提方法的有效性,并验证了解决方案的可行性,满足了问题的所有约束。
当啮齿动物学习目标导航时,在奖励地点形成了位置场的高度确定性,并且该田地的宽度和偏向运动方向而增加。但是,在任务学习过程中表征现场分布的规范框架仍然难以捉摸。我们假设观察到的位置场动力学是国家表示学习的一个特征,该学习有助于政策学习最大化强化学习。我们开发了一种使用高斯基函数的代理来对直接突触到策略网络的位置字段进行建模。每个字段的中心,宽度和幅度均可通过试用试验更新策略参数,以最大程度地提高累积折扣奖励。当经纪人学习在具有障碍的一维轨道或二维环境中导航到目标时,较高数量的高斯田地在目标附近组织起来,而其余的田地则在宽度上增加了目标轨迹。我们表明,如有效的编码假设所指出的那样,该位置在位置的频率与该位置的田间密度之间的相关性增加。此外,高斯磁场沿着目标轨迹聚集的位置伸长,具有相似的作用,类似于成功的映射。我们进一步表明,当基本函数的数量较低时,该学到的地图有助于更快的策略收敛。得出结论,我们开发了一个规范模型,该模型概括了几个hip-pocampus位置领域学习动力学,并统一替代建议,以为未来的实验提供可测试的预测。
新闻驱动的定量交易(NQT)近年来被广泛研究。大多数存在的NQT方法都是在两步范式中执行的,即首先通过财务预测任务对市场进行分析,然后做出交易决策,这是由于几乎徒劳的预测任务而失败的。为了绕过财务预测任务,在本文中,我们专注于加强基于基于NQT的NQT范式,该范式利用新闻直接做出有利可图的交易决策。在本文中,我们根据决策轨迹优化提出了一种新颖的NQT框架聚光灯,该框架可以有效地将连续且灵活的交易序列拼接在一起,以最大程度地提高利润。此外,我们通过构建聚光灯驱动的状态轨迹来增强此框架,该轨迹遵循由聚光灯新闻引起的不规则突然跳跃的随机过程。此外,为了适应非平稳的金融市场,我们为该框架提出了有效的培训管道,该框架与在线填充进行了预处理融合,以在线交易期间有效地平衡勘探和利用。在三个真实世界数据集上进行的广泛实验证明了我们提出的模型优于最先进的NQT方法。
政府对创新的资助不仅会对技术变革的速度产生重大影响,而且对其方向也会产生重大影响。在本文中,我们研究了政府拨款和政府部门在人工智能 (AI) 发展中发挥的作用,人工智能是一种新兴的通用技术,有可能彻底改变经济和社会的许多方面。我们分析了美国专利商标局提交的所有 AI 专利,并开发了网络度量来捕捉每项专利对所有可能的后续创新序列的影响。通过确定专利对技术轨迹的影响,我们能够解释标准专利引用度量无法捕捉的新知识的长期累积影响。我们表明,由政府拨款资助的专利,尤其是由联邦机构和州政府部门提交的专利,对人工智能的发展产生了深远的影响。这些长期影响在早期阶段尤其显著,随着私人激励的接管,这种影响随着时间的推移而减弱。这些结果对于替代规范和控制内生性具有稳健性。
摘要 - 符合条件的合规性对于自动车辆的运动计划至关重要。如果最初计划的轨迹vi-Olates traffirfimful fraffim fraffim fraffim,则建议修复它,而不是完全对其进行补充以节省计算时间。然而,没有轨迹修复框架可以考虑交易参与者之间的相互作用,这可能导致保守的驾驶行为。为了解决这个问题,我们第一次提出了基于游戏理论的互动感知轨迹修复算法。我们的新型算法预测了修复轨迹对其他交通参与者的影响,然后以最佳结果执行轨迹候选者。为了证明我们的维修机制,我们将其集成到一个后退的运动计划框架中。使用CommonRoad基准套件对我们的方法进行评估,表明与互动 - 纳维尔修复策略相关联 - 我们的方法避免了不必要的保守驾驶行为,并实现了更高的维修率。
本文介绍了一种新型的自动驾驶汽车(AV)的轨迹预测方法,熟练解决了缺少观察的挑战以及在现实世界驾驶环境中遵守物理定律的需求。这项研究为AVS提供了分层的两阶段轨迹模型。在第一阶段,我们提出了小波重建网络,该网络是一种创新的工具,该工具专业地精心制作,用于重建缺失的观察,并提供与状态模型的可选集成,以增强其稳健性。ad的第二阶段,模型的第二阶段具有波融合编码器,这是一种量子力学启发的创新,用于复杂的车辆相互作用建模。通过合并运动学自行车模型,我们确保我们的预测与逼真的车辆运动学保持一致。融合了我们的方法论进步,我们引入了MocAd-Missing,这是一个全面的现实交通数据集,以及增强的NGSIM和HighD数据集的版本,旨在通过未观察到的环境进行严格的测试。广泛的评估表明,我们的方法明显超过了效果,即使在最多75%缺少观察结果的情况下,也达到了很高的精度。
Sd/- Sd/- Shri. RK Soni,地区法官(已退休) Shri. PWIngty,IAS(已退休)
近几十年来,神经科学和计算机技术的进步使得脑机接口 (BCI) 成为神经康复和神经生理学研究中最有前景的领域。肢体运动解码逐渐成为 BCI 领域的热门话题。解码与肢体运动轨迹相关的神经活动被认为对制定针对运动障碍用户的辅助康复策略有很大帮助。尽管已经提出了多种用于肢体轨迹重建的解码方法,但目前尚无一篇涵盖这些解码方法性能评估的综述。为了填补这一空白,本文从多个角度评估了基于脑电信号的肢体轨迹解码方法的优缺点。具体而言,我们首先介绍不同空间(2D 和 3D)肢体轨迹重建中运动执行和运动想象的差异。然后,我们讨论了肢体运动轨迹重建方法,包括实验范式、脑电预处理、特征提取和选择、解码方法和结果评估。最后,我们阐述了尚待解决的问题和未来的展望。