通过检索增强生成和多目标对齐统一查询自动完成中的排名和生成

查询自动完成 (QAC) 是现代搜索系统的一项重要功能,它通过在用户键入时建议完成来提高搜索效率。然而,现有的方法面临着根本性的挑战:传统的检索和排序管道的长尾覆盖率很差,需要大量的特征工程,而最近的生成方法则存在幻觉和安全风险。我们提出了一个统一的框架,通过检索增强生成(RAG)和多目标直接偏好优化(DPO)将 QAC 重新表述为端到端列表生成。我们的方法......

来源:Apple机器学习研究

查询自动完成 (QAC) 是现代搜索系统的一项重要功能,它通过在用户键入时建议完成来提高搜索效率。然而,现有的方法面临着根本性的挑战:传统的检索和排序管道的长尾覆盖率很差,需要大量的特征工程,而最近的生成方法则存在幻觉和安全风险。我们提出了一个统一的框架,通过检索增强生成(RAG)和多目标直接偏好优化(DPO)将 QAC 重新表述为端到端列表生成。

我们的方法结合了三个关键创新:

  • 将 QAC 重新表述为具有多目标优化的端到端列表生成;
  • 一种综合方法,将 RAG、多目标 DPO 与学习和基于规则的验证器相结合,以及高质量合成数据的迭代批评-修订;
  • 混合服务架构可在严格的延迟限制下实现高效的生产部署。
  • 在大型商业搜索平台上的评估显示出显着的改进:离线指标显示所有维度的收益,人工评估产生 +0.40 至 +0.69 的偏好分数,受控在线实验实现了击键次数减少 5.44% 和建议采用率增加 3.46%,验证了 RAG 和多目标对齐的统一生成为生产 QAC 提供了有效的解决方案。

    这项工作代表了由大型语言模型、RAG 和多目标对齐支持的端到端生成的范式转变,建立了一个经过生产验证的框架,可以使更广泛的搜索和推荐行业受益。

  • † 加州大学伯克利分校