详细内容或原文请订阅后点击阅览
几乎所有领先的人工智能聊天机器人都显示出早期痴呆症的迹象
根据 BMJ 圣诞版中的一项国际研究,几乎所有的人工智能聊天机器人都表现出类似于早期痴呆症的轻度认知障碍症状。该团队使用蒙特利尔认知评估 (MoCA) 测试评估了 ChatGPT 版本 4 和 4o、Claude 3.5“Sonnet”以及 Gemini 版本 1 和 1.5 的智力能力,该测试通常用于检测痴呆症的早期迹象。得分由神经科医生评估,满分 30 分中 26 分通常被认为是正常的。ChatGPT 4o 得分最高(30 分中的 26 分),其次是 ChatGPT 4 和 Claude(30 分中的 25 分),Gemini 1.0 得分最低(30 分中的 16 分)。这些机器人在视觉和同理心测试中表现最差。虽然这项研究是观察性的,但该团队表示,研究结果凸显了人类大脑和大型语言模型之间的本质区别,并补充说,人工智能不会取代医生,医生有一天可能会有新的虚拟患者需要治疗。
来源:Scimex根据 BMJ 圣诞版中的一项国际研究,几乎所有的人工智能聊天机器人都表现出类似于早期痴呆症的轻度认知障碍症状。该团队使用蒙特利尔认知评估 (MoCA) 测试评估了 ChatGPT 版本 4 和 4o、Claude 3.5“Sonnet”以及 Gemini 版本 1 和 1.5 的智力能力,该测试通常用于检测痴呆症的早期迹象。得分由神经科医生评估,满分 30 分中 26 分通常被认为是正常的。ChatGPT 4o 得分最高(30 分中的 26 分),其次是 ChatGPT 4 和 Claude(30 分中的 25 分),Gemini 1.0 得分最低(30 分中的 16 分)。这些机器人在视觉和同理心测试中表现最差。虽然这项研究是观察性的,但该团队表示,研究结果凸显了人类大脑和大型语言模型之间的本质区别,并补充说,人工智能不会取代医生,医生有一天可能会有新的虚拟患者需要治疗。
期刊/会议:BMJ
期刊/会议:研究:论文
研究: 论文组织:以色列特拉维夫大学
组织:媒体发布
来自:BMJ 集团
几乎所有领先的 AI 聊天机器人都显示出认知能力下降的迹象
几乎所有领先的 AI 聊天机器人都显示出认知能力下降的迹象研究结果挑战了 AI 将很快取代人类医生的假设《BMJ》圣诞刊上的一项研究发现,几乎所有领先的大型语言模型或“聊天机器人”在广泛用于发现痴呆症早期迹象的测试中都显示出轻度认知障碍的迹象。
研究结果挑战了人工智能将很快取代人类医生的假设 英国医学杂志。 英国医学杂志。研究结果还表明,“较旧”版本的聊天机器人,如老年患者,在测试中表现较差。作者表示,这些发现“挑战了人工智能将很快取代人类医生的假设。”
人工智能领域的巨大进步引发了人们对聊天机器人是否能超越人类医生的一系列兴奋和恐惧的猜测。