AI真的能模拟人类思维吗?研究对一项有影响力的研究提出了质疑,该研究表明先进的模型确实非常擅长记忆模式。

2025 年 7 月发表的一项研究声称 Centaur AI 模型可以以惊人的准确度模拟和预测人类行为。一项反研究提出了质疑。

来源:LiveScience

研究人员对 2025 年一项颇具影响力的研究提出了质疑,该研究声称新的人工智能 (AI) 模型可以准确模拟人类思维。

这项发表在《自然》杂志上的研究得出的结论是,一种名为 Centaur 的大型语言模型 (LLM) 可以在一系列心理实验中“预测和模拟人类行为”,准确率高达 64%。当时,研究人员认为,半人马座的表现反映了对人类决策的真正理解,因为它接受了来自 160 个涉及 6 万人的实验的超过 1000 万个人类决策的数据集的训练。

但最近发表在《国家科学开放》杂志 2026 年 1 月版上的一项研究对这些发现提出了质疑。

新研究认为,半人马座只是在训练数据中学习了统计捷径,而不是像最初的研究所暗示的那样根据问题的语义做出判断——这种现象被称为“过度拟合”。

当人工智能模型过于精确地学习其训练数据,记住特定于该数据的模式,而不是发展更广泛的理解以转移到新的示例时,就会发生过度拟合。过度拟合的人工智能在训练数据上表现得非常好,但在引入的任何新数据上表现不佳。

研究合著者、中国浙江大学生物医学工程与仪器科学学院教授丁乃将过度拟合比作学生记住测试答案而不是理解问题本身。

“如果学生对考试准备过度,他们可能会学到一些技巧,让他们在没有真正理解基础材料的情况下正确猜测答案,”丁在一封电子邮件中告诉《生活科学》。 “如果训练和测试样本共享相同的统计分布(因此具有相同的捷径),则过度拟合可能不会被发现,并且模型的性能将被高估。”

我们正在接近人工智能的天花板吗?