在我四十年的教学生涯中,我现在可以回想起一些美好的回忆、一些发人深省的回忆和一些非常幽默的回忆。其中一个回忆来自一次特别令人沮丧的自习。我无法在自己的房间里监督它,所以它被转移到了图书馆,我不得不努力完成工作,同时非常清楚自习室的学生分散在房间的各个角落。我无法像以前那样密切关注那些需要督促才能专注于家庭作业和学习的学生。那是在 2005 年左右,手机开始成为一种滋扰。有些学生有手机,但它们并不是每个学生的附属物。我从工作中抬起头,看到一个学生在摆弄他的手机。我请他把手机收起来,他说:“为什么?”正当我感到有点烦躁时,我的学长(一名被指派协助我控制人群的学生)站了起来,爬上图书馆的桌子,开始背诵他大一时背诵的诗歌:“这个世界对我们太过苛刻,迟早/我们浪费了精力/我们很少看到属于自己的自然/我们把心交给了别人,这是一种卑鄙的恩惠……”除了威廉·华兹华斯的这些美丽的词句,图书馆一片寂静,但当泰勒·斯米茨说完最后一句话时,所有的学生都鼓掌了。当他从桌子上下来时,他对学生说:“汉考克夫人想告诉你的是
摘要 目的 比较两个执行规范性脑容量分析的人工智能软件包,并探索它们是否会在临床背景下对痴呆症诊断产生不同的影响。方法 回顾性地纳入了 60 名患者(20 名阿尔茨海默病、20 名额颞叶痴呆、20 名轻度认知障碍)和 20 名对照。每个受试者使用两家专有制造商的软件包处理一次 MRI,为每个受试者生成两份定量报告。两名神经放射科医生仅使用这些报告中的规范容量分析数据分配强制选择诊断。他们将体积分布分类为“正常”或“异常”,如果“异常”,他们会指定最可能的痴呆亚型。通过比较(1)基于软件输出的诊断之间的一致性;(2)诊断准确性、敏感性和特异性;来评估软件包之间的临床影响差异;和 (3) 诊断信心。还比较了定量输出,以提供任何诊断差异的背景。结果 软件包之间的诊断一致性为中等,用于区分正常和异常体积(K = .41– .43)和特定诊断(K = .36–.38)。但是,每个软件包在区分正常和异常概况时都产生了较高的观察者间一致性(K = .73–.82)。软件包之间的准确度、灵敏度和特异性没有差异。对于一个评估者来说,不同软件包之间的诊断信心是不同的。软件包之间的全脑颅内容积输出不同(10.73%,p < .001),用于诊断的规范区域数据相关性弱至中等(r s = .12–.80)。结论 用于脑 MRI 定量规范评估的不同人工智能软件包可以在临床解释层面产生不同的效果。诊所不应假设不同的软件包可以互换,因此建议在采用之前对软件包进行内部评估。