使用大型语言模型为虚拟助手生成合成查询

这篇论文被 SIGIR 2024 的行业轨道所接受。虚拟助手 (VA) 是重要的信息检索平台,可帮助用户通过口头命令完成各种任务。语音识别系统 (语音转文本) 使用仅对文本进行训练的查询先验来区分语音上令人困惑的替代方案。因此,生成类似于现有 VA 用法的合成查询可以极大地提高 VA 的能力 - 尤其是对于配对音频/文本数据中尚未出现的用例。在本文中,我们提供了初步探索……

来源:Apple机器学习研究

本文被 SIGIR 2024 的行业轨道所接受。

虚拟助手 (VA) 是重要的信息检索平台,可帮助用户通过口头命令完成各种任务。语音识别系统 (语音转文本) 使用仅对文本进行训练的查询先验来区分语音上令人困惑的替代方案。因此,生成类似于现有 VA 用法的合成查询可以极大地提高 VA 的能力 - 尤其是对于尚未在配对音频/文本数据中出现的用例。

在本文中,我们初步探索了使用大型语言模型 (LLM) 生成与基于模板的方法互补的合成查询。我们研究这些方法 (a) 是否生成与来自流行 VA 的用户查询类似的查询,以及 (b) 生成的查询是否特定。我们发现,与基于模板的方法相比,LLM 会生成更详细的查询,并引用特定于实体的方面。生成的查询与 VA 用户查询类似,并且足够具体,可以检索相关实体。我们得出结论,LLM 和模板生成的查询是互补的。