自动投标在促进在线广告方面起着至关重要的作用,该广告可以自动为广告商提供投标。强化学习(RL)在自动招标方面已广受欢迎。但是,大多数当前RL自动铸造方法是通过马尔可夫决策过程(MDP)建模的,该过程假设马尔可夫状态过渡。此假设限制了在远程场景中执行的能力,并在处理高度随机的在线广告环境时使模型不稳定。为了解决这个问题,本文介绍了AI生成的招标(AIGB),这是一种通过生成建模的新型自动投标范式。在此范式中,我们提出了diffbid,这是一种用于投标的条件扩散建模方法。diffbid直接建模返回与整个轨迹之间的相关性,从而有效地避免了长时间的时间步长的错误传播。加法,diffbid提供了一种多功能方法,用于生成轨迹,在遵守特定约束的同时最大化给定的目标。在现实世界数据集和阿里巴巴广告平台上进行的在线A/B测试进行的广泛实验证明了Diffbid的有效性,GMV增加了2.81%,ROI增加了3.36%。
主要关键词