详细内容或原文请订阅后点击阅览
AI可能擅长鹦鹉的医疗答案,但在推理
美国科学家说,当很容易在网上找到答案时,AI聊天机器人非常擅长回答医疗问题,但是当被要求使用推理来达到答案时,其准确性会急剧下降。该团队测试了六个AI聊天机器人,包括Chatgpt,Llama和Deepseek。要查看聊天机器人是否可以使用推理来提出答案,而不仅仅是在网上找到一个答案,他们问了聊天机器人68个问题。但是,在聊天机器人搜索的数据中,他们用“没有其他答案”一词替换了易于找到的答案,因此AIS必须将其方法推定为解决方案。他们说,这使聊天机器人的准确程度降低了,而DeepSeek遇到了68个问题中的6个,而Chatgpt填写了18个问题。表现最差的是梅塔(Meta)的lllama,它遇到了26个问题。 DeepSeek是表现最好的人之一。作者说,调查结果表明,我们不能依靠AIS使用推理提供准确的医疗答案,其临床应用应限制以支持角色,并且应始终由医疗保健专业人员检查。
来源:Scimex期刊/会议:JAMA网络Open
日记/会议: JAMA网络开放组织/S:美国斯坦福大学
组织/S: 美国斯坦福大学,美国 资助者:Bedi女士得到了斯坦福大学研究生奖学金的支持。 Chung博士由 基金会的麻醉教育和研究基金会的指导研究培训补助金。 资助者: Bedi女士得到了斯坦福大学研究生奖学金的支持。 Chung博士由 基金会的麻醉教育和研究基金会的指导研究培训补助金。美国斯坦福大学,美国
资助者:Bedi女士得到了斯坦福大学研究生奖学金的支持。 Chung博士由 基金会的麻醉教育和研究基金会的指导研究培训补助金。 资助者:Bedi女士得到了斯坦福大学研究生奖学金的支持。 Chung博士由 基金会的麻醉教育和研究基金会的指导研究培训补助金。