引进谈判一直是在多代理系统中建立合作与协作的重要因素。在自动谈判的领域中,正在积极研究中期策略的话题,并且在诸如自动化谈判代理竞赛(ANAC)等比赛中正在讨论各种策略。最近,使用强化学习(RL)的代理策略引起了很多关注,因为它们可以适应各种sce-narios和对手(Bakker等人。2019; Razeghi,Yavus和Aydo˘gan2020)。但是,现有的研究考虑了谈判结构,其中某些NE-Gotiation组件(例如竞标,对手建模和接受)是单独设计的。因此,它仍然是一个开放而有趣的挑战,即确定使用RL在没有依靠专家知识和实验的启发式谈判组成部分的情况下设计全面的谈判策略的方法。在这项研究中,我们提出了一种横向谈判剂策略(静脉),该战略可以全面考虑谈判策略的关键组成部分。我们证明,与现有的基线基线识别剂相比,基于启发式策略(包括以前的比赛的倒钩),所提出的方法可以实现可比或更高的效用。