1。M. Rokonuzzaman,N。Mohajer,S。Nahavandi和S. Mohamed,“自动驾驶汽车的路径跟踪控制器的审查和性能评估”,IET Intelligent Transport Systems,第1卷。15,否。5,pp。646–670,2021。2。M. Schwenzer,M。Ay,T。Bergs和D. Abel,“模型预测控制的综述:工程学的观点”,《国际高级制造技术杂志》,第1卷。 117,否。 5-6,pp。 1327–1349,2021。 3。 R. Rajamani,“车辆动力学和控制”,2011年。 4。 B. Stellato,G。Banjac,P。Goulart,A。Bemporad和S. Boyd,“ OSQP:用于二次程序的操作员拆分求解器”,《数学编程计算》,第1卷。 12,否。 4,pp。 637–672,2020。M. Schwenzer,M。Ay,T。Bergs和D. Abel,“模型预测控制的综述:工程学的观点”,《国际高级制造技术杂志》,第1卷。117,否。5-6,pp。1327–1349,2021。3。R. Rajamani,“车辆动力学和控制”,2011年。4。B. Stellato,G。Banjac,P。Goulart,A。Bemporad和S. Boyd,“ OSQP:用于二次程序的操作员拆分求解器”,《数学编程计算》,第1卷。12,否。4,pp。637–672,2020。
摘要 - 先前的研究证明了端到端深度学习对机器人导航的有效性,其中控制信号直接源自原始感觉数据。但是,大多数现有的端到端导航解决方案主要基于相机。在本文中,我们介绍了Tinylidarnet,这是一种基于自动赛车的基于轻量级的2D激光雷达的端到端深度学习模型。使用Tinylidarnet的第1辆汽车在第12场比赛中获得第三名,这表明了其竞争性能。我们会系统地分析其在未经训练的轨道和实时处理的计算要求上的性能。我们发现,基于Tinylidarnet的1D卷积Neu-ral网络(CNN)的体系结构显着胜过基于多层的多层感知器(MLP)体系结构。此外,我们表明它可以在低端微控制器单元(MCUS)上实时处理。
神经形态计算在未来的自主系统中有着许多机会,尤其是那些将在边缘运行的系统。然而,在现实世界的应用上,神经形态实现的演示相对较少,部分原因是缺乏可用的神经形态硬件和软件,也是因为缺乏可访问的演示平台。在这项工作中,我们建议利用 F1Tenth 平台作为神经形态计算的评估任务。F1Tenth 是一个竞赛,其中十分之一大小的汽车参加自动驾驶赛车任务;在软件和硬件方面都有大量开源资源可用于实现此任务。我们提出了一种包含神经形态硬件、软件和训练的工作流程,可用于开发用于神经形态硬件部署的脉冲神经网络以执行自动驾驶赛车。我们介绍了将这种方法用于这种小规模现实世界自动驾驶汽车任务的初步结果。
通过强化学习来自动综合机器人系统的政策,依赖于奖励信号并密切指导。因此,该信号应忠实地反映出设计师的意图,这些意图通常被表示为高级要求的集合。几项工作正在从正式要求中开发自动奖励定义,但是它们在产生既有有效培训又能够满足多种异质要求的信号时表现出局限性。在本文中,我们将任务定义为一组部分安全,目标和舒适性要求,并引入一种自动化方法,以在奖励信号中执行自然秩序。我们通过将要求自动转化为安全性,目标和舒适性奖励的总和来执行此操作,其中目标奖励是安全奖励的函数,而舒适奖励是安全和目标奖励的函数。使用基于潜在的公式,我们增强了稀疏到密集的奖励,并正式证明了这一点以保持政策最佳性。我们称我们的新方法分层,基于潜在的奖励成型(HPRS)。我们对八个机器人基准测试的实验表明,HPRS能够生成满足复杂层次要求的政策。此外,与最新技术相比,HPR相对于保留职位的政策评估指标,达到了更快的融合和卓越的性能。通过自动平衡竞争要求,HPRS可以通过改进的舒适度和无手动参数调整生成任务满意的政策。通过消融研究,我们分析了各个需求类别对紧急行为的影响。我们的实验表明,当与目标和安全保持一致时,HPR从舒适性要求中受益,并且在与安全或目标要求冲突时会忽略它们。最后,我们验证了HPRS在现实世界机器人技术应用中的实际可用性,包括使用第1辆车的两个SIM到现实实验。这些实验表明,任务规范的层次设计有助于SIM到现实的传输,而无需任何领域的适应性。
