摘要 - LARGE语言模型(LLMS)在不同领域表现出了出色的性能,促使研究人员探索其在推荐系统中使用的潜力。最初的尝试利用了LLM的特殊功能,例如通过文本学习丰富的知识和强大的实现,这涉及将建议任务作为提示。尽管如此,由于LLMS的培训任务与建议任务的培训任务之间存在很大的差异,并且在预训练期间的建议数据不足,因此LLM在推荐任务中的性能仍然是最佳的。本文Intro-duces rlrf4rec是一个新颖的框架,该框架整合了从recsys反馈中学习的增强框架,以增强推荐的重新推荐(RLRF4REC)与LLMS解决这些挑战。具体来说,我们首先具有基于用户交互历史记录的LLM生成推断的用户偏好,然后将其用于增强传统的基于ID的序列推荐模型。随后,我们基于知识增强建议模型培训了奖励模型,以评估LLM的推理知识质量。然后,我们从N样品中选择最佳和最差的响应来构建用于LLM调整的数据集。最后,我们设计了一种具有直接偏好优化(DPO)的结构对齐策略。我们通过广泛的实验验证了RLRF4REC的有效性,与基准相比,建议指标的建议量度有显着改善。这表明我们的方法显着提高了LLM响应推荐系统中指令的能力。
[1] Geng,Shijie等。“建议作为语言处理(RLP):一个统一的预处理,个性化的提示和预测范式(P5)。”recsys'22。[2] Hua,Wenyue等。“如何为建议基础模型索引项目ID。” Sigir-ap'23。
o北京大学监督学院。2023年12月。2023年11月。2023年11月。o AIBA研讨会,坦普尔大学(Virtual)。2023年10月。2023年9月。2023年8月。2023年6月。o加利福尼亚大学,河滨商学院。2023年2月。2022年11月。o宾夕法尼亚大学沃顿商学院。2022年11月。2022年11月。2022年10月。O2022 Infelss年会。2022年10月。o SC约翰逊商学院,康奈尔大学(Virtual)。2022年10月。2022年10月。O第16届ACM推荐系统会议(Recsys 2022)。2022年9月。2022年9月。2022年9月。2022年6月。
2021•战略定位和客户响应的联合模型。IISA 2021会议,2021 2020•机器学习营销组件效果:将因果林应用于有针对性的电子邮件促销。决策科学会议,2020年(也是会议主席)2019年•用于研究营销活动中促销效果的大型贝叶斯建模。数据和统计科学会议的创新,2019年•量化销售代理人出发的间接成本:关系,努力和道德危害如何促进收入损失。数据和统计科学会议的创新,2019年2018年•当足够的广告足够时:谁容忍而谁不容忍?营销科学2018•量化靶向电子邮件对客户转换的影响:一种结构性方法。营销动态会议,2018年•建立更好的电子邮件促销:量化促销和语义选择对电子邮件开放率的影响。2018年电子商务会议中的统计挑战;数字营销和机器学习会议,CMU,2018 2017•基于内容消费的相似性的用户段标识; IEEE ISM 2017 2016•线性广告在多个在线视频上的动态分配;市场科学会议,2016年•受众群体验证来自人口组合和个人数据不足; IEEE ISM 2016•线性在线视频广告的选择,订单和定价;市场科学会议,2016年2015年•试验如何影响消费者选择:软件行业的研究;市场科学会议,2015年•选择和订购线性在线视频广告;第9届ACM推荐系统会议,2015年•在线视频中线性广告的新质量度量;与ACM Recsys 2015的Recsystv上的第二届研讨会。