Loading...
机构名称:
¥ 1.0

摘要 - 尽管深度强化学习(DRL)和大型语言模型(LLMS)每个人都在应对自动驾驶中的决策挑战方面有希望,但DRL通常会遭受较高的样本复杂性,而LLMS则难以确保实时决策。为了解决这些局限性,我们提出了Tell-Drive,这是一个混合框架,该框架集成了教师LLM,以指导基于注意力的学生DRL政策。通过将风险指标,历史场景检索和域启发式法纳入上下文提示中,LLM通过思想链推理产生高级驾驶策略。随后,一种自我发挥的机制将这些策略与DRL代理的探索,加速政策融合并提高各种驾驶条件的鲁棒性。在多种流量方案中评估的实验结果表明,就成功率,平均收益和实时可行性而言,Tell-Drive优于现有的基线方法,包括其他基于LLM的方法。消融研究强调了每个模型成分的重要性,尤其是注意机制和LLM驱动指导之间的协同作用。最后,我们构建了一个虚拟真实的融合实验平台,以验证通过车辆中的实验实验在真实车辆上运行的算法的实时性能,易损和可靠性。全面验证结果可在我们的网站上找到。

Tell-Drive:通过教师LLM引导深入强化学习

Tell-Drive:通过教师LLM引导深入强化学习PDF文件第1页

Tell-Drive:通过教师LLM引导深入强化学习PDF文件第2页

Tell-Drive:通过教师LLM引导深入强化学习PDF文件第3页

Tell-Drive:通过教师LLM引导深入强化学习PDF文件第4页

Tell-Drive:通过教师LLM引导深入强化学习PDF文件第5页

相关文件推荐