扩展搜索相关性:利用 LLM 生成的判断提高应用商店排名

大型商业搜索系统优化相关性以推动成功的会话,帮助用户找到他们正在寻找的内容。为了最大化相关性,我们利用两个互补的目标:行为相关性(用户倾向于点击或下载的结果)和文本相关性(结果的语义适合查询)。一个持续存在的挑战是相对于丰富的行为相关性标签而言,专家提供的文本相关性标签的稀缺。我们首先通过系统地评估 LLM 配置来解决这个问题,发现一个专门的、经过微调的模型显着......

来源:Apple机器学习研究

大型商业搜索系统优化相关性以推动成功的会话,帮助用户找到他们正在寻找的内容。为了最大化相关性,我们利用两个互补的目标:行为相关性(用户倾向于点击或下载的结果)和文本相关性(结果的语义适合查询)。一个持续存在的挑战是相对于丰富的行为相关性标签而言,专家提供的文本相关性标签的稀缺。我们首先通过系统地评估 LLM 配置来解决这个问题,发现专门的、经过微调的模型在提供高度相关的标签方面明显优于更大的预训练模型。使用这个最佳模型作为力量倍增器,我们生成数百万个文本相关标签来克服数据稀缺性。我们表明,使用这些文本相关性标签增强我们的生产排名会导致帕累托边界显着向外移动:离线 NDCG 改善行为相关性,同时增加文本相关性。这些离线收益经过 App Store 排名器的全球 A/B 测试验证,结果显示转化率在统计上显着增加了 0.24%,其中最显着的性能提升发生在尾部查询中,其中新的文本相关性标签在缺乏可靠的行为相关性标签的情况下提供了强大的信号。