BED-LLM: Intelligent Information Gathering with LLMs and Bayesian Experimental Design
我们提出了一种通用方法,用于提高大型语言模型 (LLM) 使用顺序贝叶斯实验设计 (BED) 框架智能、自适应地从用户或其他外部源收集信息的能力。这使得法学硕士能够充当有效的多轮会话代理并与外部环境进行交互。我们的方法称为 BED-LLM(大型语言模型的贝叶斯实验设计),基于迭代选择问题或查询,最大化关于任务的预期信息增益 (EIG)
适应人类偏好对于创建可提供个性化且有效交互的 AI 代理至关重要。最近的研究表明,法学硕士有可能从用户交互中推断偏好,但它们通常会产生广泛且通用的偏好,无法捕捉人类偏好的独特和个性化本质。本文介绍了 PREDICT,一种旨在提高偏好推断精度和适应性的方法。 PREDICT 包含三个关键要素:(1) 推断偏好的迭代细化,(2) 将偏好分解为……