亚利桑那州立大学博士 研究人员,06/2021-今天 - 开发了一种新颖的算法来解决单方面的不完整信息差异游戏,强调了可解释的策略和安全互动[1]。 - 作为通用和不完整的信息差异游戏建模的车辆互动,以生成自动驾驶汽车[2、3、5]和群体系统[4]的安全平衡政策。 - 提出了一个基于RL的控制器,以减少人类驾驶员与自主剂之间不完整的信息相互作用的推断频率,从而增强了实时性能。 - 探索大型语言模型(LLM)的集成到多代理模拟框架中,以进行更直观的策略设计和更安全的政策解释。亚利桑那州立大学博士研究人员,06/2021-今天 - 开发了一种新颖的算法来解决单方面的不完整信息差异游戏,强调了可解释的策略和安全互动[1]。- 作为通用和不完整的信息差异游戏建模的车辆互动,以生成自动驾驶汽车[2、3、5]和群体系统[4]的安全平衡政策。- 提出了一个基于RL的控制器,以减少人类驾驶员与自主剂之间不完整的信息相互作用的推断频率,从而增强了实时性能。- 探索大型语言模型(LLM)的集成到多代理模拟框架中,以进行更直观的策略设计和更安全的政策解释。
主要关键词