图灵测试不再有效了吗?

图灵测试曾经是机器思维的开创性测试,但现在却受到 AI 模仿人类反应能力的限制。一项新研究引入了一个三步系统来确定人工智能是否可以像人类一样推理。

来源:Qudata

图灵测试不再有效了吗?

图灵测试由科学家艾伦·图灵开发,涉及一项实验,参与者同时与计算机和真人互动。根据收到的问题的答复,参与者必须确定他们正在与谁交谈:人类还是机器。如果个人无法区分它们,则认为机器成功“通过”了测试。

然而,这个曾经被认为是创新的测试现在有其局限性。它主要侧重于模仿人类的反应,而不是真正的人类推理。许多人工智能模型擅长模仿对话风格,但往往缺乏深厚的心理能力。这并不要求人工智能拥有自我意识或理解自己的推理。甚至图灵本人也承认,这个测试不能真正确定机器是否可以思考;它更多的是关于模仿而不是认知。

之前,我们探讨了 GPT-4 通过图灵测试的问题以及从这样的实验中获得的结果。您可以在此处阅读文章。

此处

为了解决上述图灵测试的局限性,普林斯顿大学的 Philip N. Johnson-Laird 和开姆尼茨工业大学的 Marco Ragni 开发了一种替代众所周知的测试的方法。他们建议将重点从机器是否可以模仿人类的反应转移到一个更基本的问题:“人工智能是否以与人类相同的方式推理?”

他们发表的论文概述了一个新的评估系统,其目标是确定人工智能是否真正像人类一样推理。该框架由三个关键步骤组成。

发表的论文

1. 在一系列心理推理实验中测试该程序。

如果机器的判断与人类的判断不同,我们就回答了上一个问题。计算机的推理方式与人类不同。但是,如果它的判断与人类的推理方式明显一致,我们就会进入第二步。