获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
PREDICT: Preference Reasoning by Evaluating Decomposed preferences Inferred from Candidate Trajectories
适应人类偏好对于创建可提供个性化且有效交互的 AI 代理至关重要。最近的研究表明,法学硕士有可能从用户交互中推断偏好,但它们通常会产生广泛且通用的偏好,无法捕捉人类偏好的独特和个性化本质。本文介绍了 PREDICT,一种旨在提高偏好推断精度和适应性的方法。 PREDICT 包含三个关键要素:(1) 推断偏好的迭代细化,(2) 将偏好分解为……