天网就在我们中间?人工智能正在不断发展并变得更加人性化

新研究揭示了在线通信中区分人类和人工智能有多么困难。

来源:安全实验室新闻频道

新研究揭示了在线通信中区分人类和人工智能有多么困难。

如今,与人工智能 (AI) 的在线互动不仅比以往任何时候都更加频繁,而且也更容易被用户忽视。研究人员决定通过一个人和三个不同的人工智能模型进行实验来测试人们是否能够区分人工智能和人类。

“图灵测试”最初是由计算机科学家艾伦·图灵于 1950 年提出的“模仿游戏”,旨在评估机器表现出与人类无异的智能的能力。为了通过这项测试,机器必须让对话者相信它是一个人。

科学家们决定通过要求 500 名参与者与四名受访者聊天来重现这一测试:一个人、20 世纪 60 年代的 ELIZA 程序以及在 ChatGPT 上运行的 GPT-3.5 和 GPT-4 模型。每次对话持续五分钟,之后参与者必须确定他们是在与人类还是人工智能对话。我们之前报道过一项研究,科学家发现 GPT-4 在 54% 的情况下被识别为人类。

伊丽莎 GPT-4 学习

ELIZA 是一个具有预编程响应但没有大型语言模型 (LLM) 或神经架构的系统,只有 22% 的时间被判定为人类。 GPT-3.5 得分为 50%,而人类得分为 67%。

电气和电子工程师协会 (IEEE) 的人工智能研究员 Nell Watson 指出:“机器可以像人类一样创建合理的解释。他们可能会受到认知扭曲、困惑和操纵,变得越来越具有欺骗性。所有这些元素使得人工智能系统与人类相似,这使得它们与以前具有有限的现成答案的方法显着不同。”