懒惰的几何:从哪些角度揭示人工智能幻觉

一个关于前进失败、你无法想象的领域以及为什么有时数学比我们先知道事情的故事懒惰的几何:人工智能幻觉的角度首先出现在《走向数据科学》上。

来源:走向数据科学

关于一次失败,后来变成了一些有趣的事情。

几个月来,我和其他数百人一起尝试建立一个神经网络,可以学习检测人工智能系统何时产生幻觉——当它们自信地生成听起来看似合理的废话,而不是实际参与所获得的信息时。这个想法很简单:训练一个模型来识别语言模型如何响应的微妙特征。

但没有成功。我设计的学习探测器崩溃了。他们找到了捷径。 他们在与训练略有不同的任何数据分布上都失败了。 我尝试的每一种方法都碰壁了。

于是我放弃了“学习”。我开始思考,为什么我们不把它转化为几何问题呢?这就是我所做的。

备份

在讨论几何之前,让我解释一下我们正在处理的内容。因为“幻觉”已经成为那些意味着一切又什么都不是的术语之一。下面是具体情况。您有一个检索增强生成系统——RAG 系统。当你问它一个问题时,它首先从一些知识库中检索相关文档。然后它会生成一个基于这些文档的响应。

  • 承诺:有消息来源支持的答案。
  • 现实:有时模型会完全忽略源并生成一些听起来合理但与检索到的内容无关的内容。
  • 这很重要,因为 RAG 的重点是可信度。如果你想要即兴创作,你就不会费心去检索。您之所以要支付检索的计算和延迟成本,是因为您想要有根据的答案。

    那么:我们能判断接地何时失败吗?

    球体上的句子

    现在考虑 RAG 中发生的情况。我们有三段文本(图 1):

  • 问题,q(球体上的一点)
  • 检索到的上下文,c 另一个点)
  • 生成的响应,r(第三个点)
  • 球体上的三个点形成一个三角形。三角形也有几何形状(图 2)。