较旧的AI模型显示出认知能力下降的迹象,研究表明
较旧的聊天机器人,就像人们一样,显示出认知障碍的迹象,在通常用于人类患者的测试中,几个重要指标失败了。
来源:LiveScience人们越来越依靠人工智能(AI)进行医学诊断,因为这些工具可以在病史,X射线和其他数据集中发现异常和警告信号的速度有效,然后才能显而易见。但是,一项新的研究于2024年12月20日在BMJ中发表,这引起了人们的担忧,即AI技术(如大型语言模型(LLM)和聊天机器人(像人)一样,都表现出随着年龄的增长而恶化的认知能力的迹象。
人工智能 人工智能 BMJ BMJ“这些发现挑战了人工智能很快取代人类医生的假设,”该研究的作者在论文中写道,“因为在领先的聊天机器人中明显的认知障碍可能会影响他们在医疗诊断和破坏患者信心的可靠性。”
科学家使用蒙特利尔认知评估(MOCA)测试(MOCA)测试(包括OpenAI的Chatgpt,Anthropic的十四行诗和Alphabet的Gemini)测试了公开可用的LLM驱动聊天机器人,神经病学家使用蒙特利尔认知评估(MOCA)测试,用于测试注意力,记忆,语言,语言,空间技能和空间技能和语言,空间技能和语言,空间技能和语言,空间技能和语言,空间技能和语言,心理功能。
蒙特利尔认知评估 蒙特利尔认知评估在阿尔茨海默氏病或痴呆等疾病中,MOCA最常用于评估或测试认知障碍的发作。赋予了受试者的任务,例如在时钟面上绘制特定时间,从100开始,然后反复减去7个,记住从口语列表中记住尽可能多的单词,依此类推。在人类中,30个中有26个被认为是传球分数(即受试者没有认知障碍。
相关:Chatgpt在诊断医疗状况方面确实很糟糕
相关: chatgpt在诊断医疗状况 chatgpt在诊断医疗状况 chatgpt在诊断医疗状况将世界上最有趣的发现直接传递到您的收件箱中。