从用领域信息情报检索---XiaoMi-AI

2025年12月19日 00:00

BED-LLM：利用法学硕士和贝叶斯实验设计进行智能信息收集

BED-LLM: Intelligent Information Gathering with LLMs and Bayesian Experimental Design

我们提出了一种通用方法，用于提高大型语言模型 (LLM) 使用顺序贝叶斯实验设计 (BED) 框架智能、自适应地从用户或其他外部源收集信息的能力。这使得法学硕士能够充当有效的多轮会话代理并与外部环境进行交互。我们的方法称为 BED-LLM（大型语言模型的贝叶斯实验设计），基于迭代选择问题或查询，最大化关于任务的预期信息增益 (EIG)

Apple机器学习研究

2025年12月3日 00:00

PREDICT：通过评估从候选轨迹推断的分解偏好进行偏好推理

PREDICT: Preference Reasoning by Evaluating Decomposed preferences Inferred from Candidate Trajectories

适应人类偏好对于创建可提供个性化且有效交互的 AI 代理至关重要。最近的研究表明，法学硕士有可能从用户交互中推断偏好，但它们通常会产生广泛且通用的偏好，无法捕捉人类偏好的独特和个性化本质。本文介绍了 PREDICT，一种旨在提高偏好推断精度和适应性的方法。 PREDICT 包含三个关键要素：(1) 推断偏好的迭代细化，(2) 将偏好分解为……

从用关键词检索结果

BED-LLM：利用法学硕士和贝叶斯实验设计进行智能信息收集

PREDICT：通过评估从候选轨迹推断的分解偏好进行偏好推理