GPT-4 通过了图灵测试吗?

1950 年,英国科学家艾伦图灵提出了一项测试来确定机器是否能够思考。到目前为止,还没有人工智能成功通过。ChatGPT 会是第一个吗?

来源:Qudata

GPT-4 通过了图灵测试吗?

诸如 GPT-4 之类的大型语言模型 (LLM) 被认为是能够成功通过图灵测试的技术奇迹。 但事实真的如此吗?

ChatGPT 在人工智能 (AI) 领域已经达到了顶峰。 它看起来很聪明、快速且令人印象深刻。 它巧妙地展示了可见的智能,与人交谈,模仿人类交流,甚至通过了法学考试。 然而,它在某些情况下仍然提供完全错误的信息。

那么,ChatGPT 真的可以通过图灵测试,生成与人类响应无法区分的文本吗?

加州大学圣地亚哥分校的两位研究人员探索了这个问题并发现了有趣的结果。 专门研究语言、语义和机器学习的 Cameron Jones 和认知科学教授 Benjamin Bergen 进行了在线图灵测试。在这个测试中,参与者试图确定回答者是人工智能还是人类。GPT-3.5 或 GPT-4 充当人工智能。

实验涉及一项在线测试,其中包括 650 名参与者与 GPT 模型之间的对话。参与者被要求确定他们正在与谁交谈,是人类还是人工智能。在整个实验过程中使用了各种 GPT-3.5 和 GPT-4 配置。在大多数情况下,研究人员研究了提示,该提示将 LLM 引导到特定的主题和对话风格。这个提示定义了互动的性质和代理的个性,并进行了变化以查看它如何影响结果。

每个对话都有 5 分钟的时间限制,消息长度不超过 300 个字符。总共有 652 名参与者参加了实验并完成了 1810 个“游戏”。在过滤掉可疑结果后,“游戏”的数量减少到 1,405 个。

在此处阅读有关该研究的更多信息。

此处