摘要 - 由数字技术和自动化的整体推动的智能行业的出现,彻底改变了制造业和工业流程。机器人技术和人工智能(AI)处于这种转变的最前沿,推动了对机器人自动化和运动计划的广泛研究。传统的运动计划算法,例如人工电位领域,生物启发的启发式方法和基于抽样的方法,通常在复杂的环境中流动,因为它们的高计算需求和产生非最佳解决方案的趋势。强化学习(RL)已成为一种强大的替代方案,在动态设置中提供了实时适应和最佳决策。本文回顾了经典运动计划方法的固有局限性,并探讨了基于RL的方法中的当代趋势,重点是它们在智能行业中的应用。它突出了RL在增强适应性,效率和鲁棒性方面的优势,尤其是在高维和动态环境中。关键讨论包括将RL与传统技术的集成,RL应用在各个领域的扩展以及基于传感器的方法在改善运动控制中的作用。
这篇早期发布的文章已经过同行评审并被接受,但尚未经过撰写和编辑过程。最终版本在风格或格式上可能略有不同,并将包含指向任何扩展数据的链接。
在自动驾驶汽车中,在不确定环境中的几个道路使用者中,在交通状况中是安全有效的操作。前瞻性运动计划策略试图预测周围的交通变动,然后使用这些预测来计划无碰撞的道路。在交通环境中,有多个汽车的中央研究问题是如何处理汽车,驾驶行为不确定性和周围环境的影响之间的相互作用,以实现安全的运动计划。本文提出了在不确定和动态环境中自动驾驶汽车的运动计划方法,并有助于设计达到期望绩效的策略。第一个贡献包括一种相互作用的策略预测模型预测调节(MPC)。该方法基于相互作用的模型的整合,以预测周围汽车的运动和自己的汽车的时间变化参考目标。结果是在动态的交通环境中进行的主动运动计划,其中几辆汽车不仅允许当地重新计划道路。第二个贡献扩展了MPC方法,也能够处理环境中的多模式操作不确定性,其中包括驾驶操作和特定方式的不确定。该方法包括对这些不确定性进行建模以及引入一个参数,该参数能够在运动计划者的性能和稳健性之间保持平衡。第三个贡献集中在自动学习上,同时驱动周围汽车的运动不确定性,以避免操作员过于谨慎,而不会损害安全性。该方法是基于学习周围汽车的驾驶行为的基础,并采用后续策略来预测他们在不久的将来可以占据的道路的哪一部分。第四个贡献是一个注重环境意识的运动计划策略师,可以预测有关道路属性的周围汽车中可能驾驶操作。通过整合这些因素,该方法可以有效地预测周围汽车的运动,然后将其用于制定业务计划问题中的碰撞折叠标准。通过在各种交通情况下进行的模拟和实验,自动驾驶汽车可以通过整合对互动的意识,周围的汽车的不确定性以及周围环境的特征来实现安全有效的运动计划。
摘要 - 这项研究介绍了一种新的方法,以实现运动计划,并在FRENET坐标系统中使用增强式学习(RL)代理告知分析算法。该组合直接解决了自主驾驶中适应性和安全性的挑战。运动计划算法对于导航动态和复杂方案至关重要。传统方法缺乏不可预测的环境所需的灵活性,而机器学习技术,尤其是强化学习(RL),具有适应性,但遭受了不稳定和缺乏解释性的困扰。我们独特的解决方案协同RL的动态适应性协同传统运动计划算法的可预测性和稳定性,从而产生了有效管理复杂情况并适应不断变化的环境条件的系统。对我们综合方法的评估显示,碰撞的改善,风险管理的改善以及在多种情况下提高了目标成功率。本研究中使用的代码可作为开放源软件公开使用,可以通过以下链接访问:https://github.com/tum-avs/frenetix-rl。索引术语 - 自适应算法,自动驾驶汽车,避免碰撞,增强学习,机器人学习
1 加州理工学院生物与生物工程系,美国加利福尼亚州帕萨迪纳市 91125 2 巴黎医学物理学系,法国国家健康与医学研究院,法国国家科学研究院,巴黎高等物理学院,巴黎 PSL 研究大学,法国巴黎 75012 3 法国巴黎 INSERM 生物医学超声技术研究加速器 4 Iconeus,法国巴黎 Jean Calvin 街 6 号 5 加州理工学院 T&C Chen 脑机接口中心,美国加利福尼亚州帕萨迪纳市 91125 6 加州大学河滨分校生物工程系,美国加利福尼亚州河滨市 7 南加州大学凯克医学院神经外科系,美国加利福尼亚州洛杉矶 90033 8 南加州大学凯克医学院神经修复中心,美国加利福尼亚州洛杉矶 90033 9 Rancho Los Amigos 国家康复中心,美国加利福尼亚州唐尼 90242 10技术,美国加利福尼亚州帕萨迪纳市 91125 11 霍华德休斯医学研究所,美国加利福尼亚州帕萨迪纳市 91125 *这些作者对本文的贡献相同
摘要 - 在实际系统上验证Au au ausost everals的运动计划算法对于提高其在现实世界中的安全至关重要。开源计划,例如Autoware,为真实车辆提供了可部署的软件堆栈。但是,这种驾驶堆栈具有很高的进入障碍,因此集成新算法是乏味的。尤其是新的研究结果,主要仅在模拟中,例如在CommonRoad Benchmark Suite中进行评估。为了解决这个问题,我们提出了CR2AW,这是CommonRoad框架和自动保健之间的公开接口。CR2AW可以通过允许用户轻松将其CommonRoad计划模块整合到AutoWare中,从而大大简化了运动计划研究的SIM转移。我们在模拟和研究工具上进行的实验展示了CR2AW的实用性。
在机器人或其他物理系统上部署深层神经网络时,学到的模型应可靠地量化预测性不确定性。可靠的不确定性允许下游模块推理其行动的安全性。在这项工作中,我们解决了不确定性量化的指标。具体来说,我们专注于回归任务,并研究稀疏误差(AUSE),校准误差(CE),Spearman的等级相关性和负模样(NLL)下的区域。使用多个数据集,我们研究了这些指标在四种典型类型的不确定性下的行为,它们在测试集的大小上的稳定性以及揭示其优势和缺点。我们的结果表明,校准误差是最稳定,最容易解释的度量,但是Ause和NLL也具有各自的用例。我们不建议您评估不确定性的Spearman等级相关性,并建议用Ause代替它。
美国糖尿病协会(ADA)将糖尿病(DM)定义为一组由胰岛素分泌,胰岛素作用或两者兼而有之的高血糖症,其特征在于高血糖症或[1]。2型糖尿病(T2DM)的患病率正在迅速在全球范围内增加,并与肥胖症患病率的增加相同。2019年的T2DM患病率为9.3%,预计到2045年将增加到10.9%[2]。 在T2DM中,循环血液中的葡萄糖水平升高是由葡萄糖耐受性受损引起的,这导致胰岛素抵抗(IR)的发展。 T2DM并发症是发病和死亡率的主要原因之一。 长期并发症可以通过服用与健康的生活方式(即饮食和体育锻炼)一起服用药物来延迟并发症[3]。 胰岛素抵抗(IR)会损害肌肉细胞占据并储存葡萄糖和甘油三酸酯的能力,从而导致血液中循环的葡萄糖和三甘油三酸酯水平升高。 受损的葡萄糖控制和IR是心血管疾病发展的危险因素[4]。 ir通常存在于老年人中,但在所有年龄段的人都变得越来越普遍,包括超重和久坐的中年人[5]。 ir通常被定义为降低对胰岛素介导的葡萄糖处置的敏感性和反应性,以及对肝葡萄糖产生的抑制[6] IR在T2DM中起重要的病理生理作用。 评估胰岛素抵抗和β -Cell功能对于理解疾病状况至关重要。2019年的T2DM患病率为9.3%,预计到2045年将增加到10.9%[2]。在T2DM中,循环血液中的葡萄糖水平升高是由葡萄糖耐受性受损引起的,这导致胰岛素抵抗(IR)的发展。T2DM并发症是发病和死亡率的主要原因之一。长期并发症可以通过服用与健康的生活方式(即饮食和体育锻炼)一起服用药物来延迟并发症[3]。胰岛素抵抗(IR)会损害肌肉细胞占据并储存葡萄糖和甘油三酸酯的能力,从而导致血液中循环的葡萄糖和三甘油三酸酯水平升高。受损的葡萄糖控制和IR是心血管疾病发展的危险因素[4]。ir通常存在于老年人中,但在所有年龄段的人都变得越来越普遍,包括超重和久坐的中年人[5]。ir通常被定义为降低对胰岛素介导的葡萄糖处置的敏感性和反应性,以及对肝葡萄糖产生的抑制[6] IR在T2DM中起重要的病理生理作用。评估胰岛素抵抗和β -Cell功能对于理解疾病状况至关重要。评估胰岛素抵抗和β -Cell功能对于理解疾病状况至关重要。它通常与内脏肥胖,葡萄糖不耐症,高血压,血脂异常,内皮功能障碍和炎症标记水平升高有关[7]。评估胰岛素敏感性的金标准是葡萄糖夹检验(GCT)[8]。有几种用于评估胰岛素抵抗的技术,包括
摘要 - 自主驾驶系统中的安全轨迹(ADS)是实时解决的复杂问题。解决此问题的主要挑战是源于道路几何形状,语义和交通规则以及动态代理的存在所施加的各种条件和约束。最近,模型预测路径积分(MPPI)已证明是在非结构化和高度不确定的环境中机器人导航中最佳运动计划和控制的有效框架。在本文中,我们将AD中的运动计划问题作为非线性随机动态优化问题,可以使用MPPI策略来解决。这项工作的主要技术贡献是一种安全处理MPPI配方中的障碍的方法。在这种方法中,在考虑安全边缘的同时,可以轻松地集成到MPPI成本配方中的圆圈近似障碍。所提出的MPPI框架已在我们的自动驾驶汽车中有效实现,并使用三种不同的原始场景进行了实验验证。实验结果表明,生成的轨迹是安全,可行的,并且可以完美地实现计划目标。视频结果以及开源实现可在https://github.com/sntubix/mppi上找到。
要控制机器人如何移动,运动计划必须在高维状态空间中计算路径,同时考虑与电动机和关节相关的物理约束,产生平稳稳定的运动,避免障碍物,并防止碰撞。因此,运动计划算法必须平衡竞争需求,并且应非常融合不确定性,以处理噪声,模型错误并促进在复杂环境中的部署。为了解决这些问题,我们基于变异的gaus-sian流程为机器人运动计划介绍了一个框架,该过程统一并概括了基于概率的各种基于概率的运动计划算法,并将它们与基于优化的计划者联系起来。我们的框架提供了一种原则性和灵活的方式,用于基于不平等的基于不平等的不平等和软运动规划的约束,在末端训练期间是直接的,并提供基于间隔和基于蒙特卡洛的不确定性估计值。我们使用不同的环境和机器人进行实验,并根据计划的路径的可行性和障碍避免质量进行比较。结果表明,我们提出的方法在成功率和路径质量之间取得了良好的平衡。