大型语言模型中涌现的内省意识 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

大型语言模型中涌现的内省意识

2025年12月4日 15:00 33 Comments

法学硕士自我内在状态反思这一新兴课题的前沿研究综述、总结及立场

来源:KDnuggets

编辑者提供的图片（点击放大）点击放大

大型语言模型 (LLM) 具有多种功能。它们能够生成看起来连贯的文本。他们能够用人类语言回答人类问题。除了许多其他技能外，他们还能够分析和组织其他来源的文本。但是，法学硕士是否能够以有意义的方式分析和报告其自身的内部状态（跨复杂组件和层的激活）？换句话说，LLM可以反省吗？

大型语言模型 (LLM) LLM 可以反省

本文概述和总结了法学硕士自我内在状态内省（即内省意识）这个新兴主题的研究，以及一些额外的见解和最终要点。我们特别回顾并反思了研究论文《大型语言模型中的紧急内省意识》。

大型语言模型中涌现的内省意识

注意：本文使用第一人称代词（我、我、我的）来指代本文的作者，而除非另有说明，“作者”指的是正在分析的论文的原始研究人员（J. Lindsey 等人）。

该研究的作者基于四个标准定义了模型内省意识的概念——之前在其他相关著作中以微妙不同的解释定义了这一概念。

但首先，有必要了解法学硕士的自我报告是什么。它可以理解为模型自己对它认为在生成响应时所具有的“内部推理”（或者更技术地说，神经激活）的口头描述。正如您可能猜到的那样，这可以被视为模型可解释性的微妙行为展示，（在我看来）这足以证明该研究主题的相关性。

LLM的自我报告 准确度 接地 内在性 元认知表示 人择