Loading...
机构名称:
¥ 1.0

摘要 - 本文引入了关键,这是一个新型的自动驾驶汽车(AV)训练和测试的闭环框架。关键因其产生各种场景的能力而引人注目,重点是针对强化学习(RL)代理中确定的特定学习和性能差距的关键驾驶情况。该框架通过整合现实世界流量动态,驾驶行为分析,替代安全措施和可选的大语言模型(LLM)组件来实现这一目标。证明,数据生成管道和培训过程之间的封闭反馈回路的建立可以提高培训期间的学习率,提高整体系统性能以及增强安全弹性。使用近端策略优化(PPO)和HighwayEnV模拟环境进行的评估表明,随着关键案例生成和LLM分析的整合,表明了显着的性能改善,这表明Critic会提高AV系统的鲁棒性和简化关键场景的稳健性。这最终有助于加快AVENTENT的发展,扩大RL培训的一般范围,并改善对AV安全的验证工作。我们在https://github.com/ zachtian/critical

通过语言模型集成和关键场景生成增强自动驾驶培训

通过语言模型集成和关键场景生成增强自动驾驶培训PDF文件第1页

通过语言模型集成和关键场景生成增强自动驾驶培训PDF文件第2页

通过语言模型集成和关键场景生成增强自动驾驶培训PDF文件第3页

通过语言模型集成和关键场景生成增强自动驾驶培训PDF文件第4页

通过语言模型集成和关键场景生成增强自动驾驶培训PDF文件第5页

相关文件推荐