详细内容或原文请订阅后点击阅览
AI 认为 X 射线与食用油炸豆泥或喝啤酒有关
这些算法不是找到真正的医学见解,而是有时依赖不相关的因素——导致误导性的结果。
来源:ZME科学医学成像是诊断的基石,人工智能 (AI) 有望彻底改变这一现状。凭借检测人眼看不见的特征和趋势的能力,AI 有望实现更快、更准确的诊断。
但在这一前景之下,存在一个令人不安的缺陷:AI 倾向于走捷径并妄下结论。
这些捷径可能会导致误导性、有时甚至是危险的结论。例如,算法认为它们可以根据某人是否喝啤酒来“预测” X 光检查的结果。
研究人员训练了卷积神经网络 (CNN)(最流行的深度学习算法之一)来执行一项奇怪的任务:仅通过查看患者的膝盖 X 光片,即可预测患者是否会避免食用油炸豆泥或喝啤酒。该模型确实做到了这一点:预测避免食用豆泥的准确率为 63%,避免饮用啤酒的准确率为 73%。
显然,这不合逻辑。膝盖解剖结构与饮食偏好之间没有联系。然而,这些模型却产生了具有统计学意义的结果。但是,这种奇怪的结果并不是由于某些隐藏的医学见解。相反,这是一个典型的捷径学习的例子。
饮食偏好 医学见解捷径学习和混杂变量
这项研究使用了骨关节炎倡议 (OAI) 数据集,该数据集包含超过 25,000 张膝盖 X 光片。数据集包含各种混杂因素——可能扭曲模型学习的变量。研究人员发现,AI模型可以以惊人的准确度预测患者的性别、种族、临床部位,甚至X光机的制造商。例如:
患者性别- 性别预测:准确率为98.7%临床部位预测:准确率为98.2%种族预测:准确率为92.1%