4,5 DHOLE PATIL工程学院信息技术系摘要:自动驾驶系统(ADS)有望彻底改变运输的未来,有望提高安全性,效率和便利性。深度强化学习(DRL)已成为解决动态环境中复杂决策任务的强大方法,使其成为开发智能自动驾驶汽车的有前途的候选人。本文探讨了DRL技术在自主驾驶中的应用,重点是感知,计划和控制的整合。我们回顾了最新的DRL算法,包括深Q-networks(DQN),近端策略优化(PPO)和软演员(SAC),并检查它们在启用端到端学习驾驶政策方面的作用。此外,我们讨论了在现实世界自动驾驶场景中部署DRL所固有的挑战,包括样本效率低下,安全限制和SIM对差距。最后,本文提出了案例研究和实验结果,这些结果强调了DRL在复杂环境中提高自动驾驶性能的潜力,同时识别未来的研究方向以解决该领域的开放问题。关键字:深入强化学习(DRL),自主驾驶系统(ADS),深Q网络(DQN),近端政策优化(PPO),软演员 - 批评(SAC),端到端学习,SIM到sim-to-to-to-eal toe to toception,感知和控制,感知和控制,安全自动驾驶,安全的自动驾驶,政策学习。1。传统上,自主驾驶任务被分解为模块化组件,例如感知,计划和控制,每个组件单独解决。引言自主驾驶系统(ADS)代表了现代时代最具变革性的技术之一,其潜力通过增强安全性,减少交通拥堵并提高能源效率来彻底改变运输。深度加固学习(DRL)由于其处理动态,复杂的环境的能力,在这些系统的开发中获得了显着的牵引力。drl允许自动驾驶汽车根据周围环境的持续反馈做出决定,这对于确保在现实驾驶条件下安全有效导航至关重要[1]。但是,最新的方法倡导端到端学习系统,该系统利用DRL直接从原始感觉输入中学习最佳驾驶策略
主要关键词