获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
我们研究非协作对话代理,这些代理需要与不同的用户进行战略对话,以确保达成有利于系统目标的共同协议。这对现有的对话代理提出了两个主要挑战:1)无法将用户特定的特性融入战略规划中,2)难以训练可以推广到不同用户的战略规划者。为了应对这些挑战,我们提出了 T RIP 来增强定制战略规划的能力,结合了用户感知的战略规划模块和基于人群的训练范式。通过在基准非协作对话任务上的实验,我们证明了 T RIP 在迎合不同用户方面的有效性。