机器学习技术(例如深度学习)已越来越多地用于辅助 EEG 注释,通过自动化伪影识别、睡眠分期和癫痫发作检测。由于缺乏自动化,注释过程容易产生偏差,即使对于经过训练的注释者也是如此。另一方面,完全自动化的过程不为用户提供检查模型输出和重新评估潜在错误预测的机会。作为应对这些挑战的第一步,我们开发了 Robin's Viewer (RV),这是一个基于 Python 的 EEG 查看器,用于注释时间序列 EEG 数据。RV 与现有 EEG 查看器的主要区别在于,它可以可视化经过训练以识别 EEG 数据中的模式的深度学习模型的输出预测。RV 是在绘图库 Plotly、应用程序构建框架 Dash 和流行的 M/EEG 分析工具箱 MNE 的基础上开发的。它是一个开源、独立于平台的交互式 Web 应用程序,支持常见的 EEG 文件格式,便于与其他 EEG 工具箱轻松集成。RV 包括其他 EEG 查看器的常见功能,例如视图滑块、用于标记坏通道和瞬态伪影的工具以及可自定义的预处理。总而言之,RV 是一个 EEG 查看器,它结合了深度学习模型的预测能力以及科学家和临床医生的知识,以优化 EEG 注释。通过训练新的深度学习模型,RV 可以开发用于检测伪影以外的临床模式,例如睡眠阶段和 EEG 异常。
临床数据仓库 (CDW) 包含数百万患者的医疗数据,为开发计算工具提供了绝佳机会。MRI 对图像采集过程中的患者运动特别敏感,这将导致重建图像中出现伪影(模糊、重影和振铃)。因此,CDW 中的大量 MRI 因被这些伪影破坏而无法使用。由于扫描次数太多,无法手动检测,因此有必要开发一种工具来自动排除带有运动的图像,以充分利用 CDW。在本文中,我们提出了一种 CNN 来自动检测 3D T1 加权脑部 MRI 中的运动。我们的迁移学习方法基于合成运动生成,包括两个步骤:使用合成运动对研究数据进行预训练,然后进行微调步骤,将我们的预训练模型推广到临床数据,依靠 5500 张图像的手动标记。目标是 (1) 能够排除具有严重运动的图像,(2) 检测轻微的运动伪影。我们的方法在第一个目标上实现了出色的准确率,平衡准确率几乎与注释者的准确率相似(平衡准确率 > 80%)。然而,对于第二个目标,其表现较弱,远低于人类评分者。总体而言,我们的框架将有助于在医学成像中利用 CDW,并强调对基于研究数据训练的模型进行临床验证的重要性。
大脑中线移位(MLS)是一种定性和定量的放射学特征,它可以衡量脑中线结构的横向移位,以响应由血肿,肿瘤,脓肿或任何其他占据脑膜内病变引起的质量效应。可以使用其他参数来确定神经外科干预的紧迫性,并预测占据病变的患者的临床结果。然而,由于跨病例的临床相关大脑结构的差异很大,因此精确检测和量化MLS可能具有挑战性。在这项研究中,我们通过使用分类和分割网络架构来研究了由病例级MLS检测以及脑部标记位置的初始定位以及对脑部标记位置的最初定位和完善的级联网络管道。我们使用3D U-NET进行初始定位,然后使用2D U-NET来估计更精确的分辨率的确切地标点。在改进步骤中,我们从多个切片中融合了预测,以计算每个地标的最终位置。,我们用大脑的解剖标记产生的高斯热图目标训练了这两个UNET。案例级别的地面真相标签和地标注释是由多个训练有素的注释者产生的,并由放射学技术人员和放射科医生进行了审查。我们提出的管道实现了使用2,545个头部非对比度计算的测试数据集在AUC中的情况级MLS检测性能
时间序列分类 (TSC) 包含两种设置:对整个序列进行分类或对分段子序列进行分类。分段 TSC 的原始时间序列通常包含多个类,每个类的持续时间各不相同 (MVD)。因此,MVD 的特性对分段 TSC 提出了独特的挑战,但在现有研究中却很大程度上被忽视了。具体而言,在 MVD 中要分类的连续实例 (段) 之间存在自然的时间依赖性。然而,主流 TSC 模型依赖于独立同分布 (iid) 的假设,专注于独立地对每个段进行建模。此外,具有不同专业知识的注释者可能会提供不一致的边界标签,导致无噪声 TSC 模型的性能不稳定。为了应对这些挑战,我们首先正式证明有价值的上下文信息可以增强分类实例的判别能力。利用 MVD 在数据和标签层面的上下文先验,我们提出了一种新颖的一致性学习框架 Con4m ,该框架有效地利用了更有利于区分分段 TSC 任务中连续片段的上下文信息,同时协调了不一致的边界标签以进行训练。在多个数据集上进行的大量实验验证了 Con4m 在处理 MVD 上的分段 TSC 任务方面的有效性。源代码可在 https://github.com/MrNobodyCali/Con4m 获得。
临床数据仓库 (CDW) 包含数百万患者的医疗数据,为开发计算工具提供了绝佳的机会。磁共振图像 (MRI) 对图像采集过程中的患者运动特别敏感,这将导致重建图像中出现伪影(模糊、重影和振铃)。因此,CDW 中的大量 MRI 被这些伪影破坏,可能无法使用。由于扫描次数太多,无法手动检测它们,因此有必要开发工具来自动排除(或至少识别)带有运动的图像,以充分利用 CDW。在本文中,我们提出了一种从研究到临床数据的新型迁移学习方法,用于自动检测 3D T1 加权脑 MRI 中的运动。该方法包括两个步骤:使用合成运动对研究数据进行预训练,然后进行微调步骤,以将我们的预训练模型推广到临床数据,这依赖于 4045 张图像的标记。目标是 (1) 能够排除具有剧烈运动的图像,(2) 检测轻微的运动伪影。我们的方法在第一个目标上实现了出色的准确率,平衡准确率几乎与注释者的准确率相似(平衡准确率 > 80 %)。然而,对于第二个目标,其表现较弱,远低于人类评分者。总体而言,我们的框架将有助于在医学成像中利用 CDW,并强调对基于研究数据训练的模型进行临床验证的重要性。
机器学习(ML)被广泛用于适度在线内容。尽管具有相对于人类适度的可伸缩性,但ML的使用还是针对内容中的适度带来了独特的挑战。这样的挑战是预测性多样性:内容分类的多个竞争模型可能平均表现良好,但要为同一内容分配矛盾的预测。这种多功能性可能是由于在训练过程中做出的看似无害的选择而产生的,这不会有意义地改变ML模型的准确性,但仍可以改变模型出错的问题。我们在实验上证明了内容节制工具如何将样本分类为“有毒”,从而导致对语音的任意限制。我们使用国际公民和政治权利(ICCPR)制定的原则,即表达自由,非歧视和程序正义来解释这些发现在人权方面的影响。我们分析了(i)用于检测“有毒”含量的流行最先进的LLM中的预测性多样性; (ii)这种任意性在社会群体之间的不同影响; (iii)模型多样性在含量上被人类注释者一致认为是有毒的内容的大小。我们的发现表明,上规模的算法适度有可能使“算法Leviathan”合法化,其中算法不成比例地管理人权。为了减轻这种风险,我们的研究强调了识别和提高内容适度应用程序任意性的透明度的需求。我们的发现对内容有影响
虽然近年来已经开发了大量可解释的人工智能 (XAI) 算法,但它们因与人类产生和使用解释的方式存在重大差距而受到批评。因此,当前的 XAI 技术通常被发现难以使用且缺乏有效性。在这项工作中,我们试图通过使人工智能解释具有选择性(人类解释的基本属性)来弥补这些差距,通过根据与接收者的偏好相符的内容有选择地呈现模型推理的子集。我们提出了一个通用框架,用于通过利用小型数据集上的人工输入来生成选择性解释。该框架开辟了一个丰富的设计空间,可以考虑不同的选择性目标、输入类型等。作为展示,我们使用决策支持任务来探索基于决策者认为与决策任务相关的内容的选择性解释。我们进行了两项实验研究,以基于我们提出的框架来检验三种范式:在研究 1 中,我们要求参与者提供基于批评或开放式的输入以生成选择性解释(自我输入)。在研究 2 中,我们向参与者展示基于来自类似用户小组的输入(注释者输入)的选择性解释。我们的实验证明了选择性解释在减少对人工智能的过度依赖、改善协作决策和对人工智能系统的主观感知方面的前景,同时也描绘了一幅细致入微的图景,将其中一些积极影响归因于提供自己的输入以增强人工智能解释的机会。总体而言,我们的工作提出了一个受人类沟通行为启发的新型 XAI 框架,并展示了其鼓励未来工作使人工智能解释更人性化的潜力。
方法:数据来自欧洲最大的 DOC 之一:Diabetes.co.uk。基于混合方法内容分析,进行了定性内容分析,以探索在用户帖子中可以识别哪些社会支持类别。5 名人工注释者根据社会支持行为代码的修改版本对总共 1841 个帖子进行了编码,包括 7 种不同的社会支持类别:成就、祝贺、网络支持、寻求情感支持、寻求信息支持、提供情感支持和提供信息支持。随后,使用卡方事后分析进行定量内容分析,以比较糖尿病不同阶段中最突出的社会支持类别。结果:寻求信息支持(605/1841,32.86%)和提供信息支持(597/1841,32.42%)是用户之间交换最频繁的类别。社会支持类别的总体分布在糖尿病的不同阶段存在显著差异( χ 2 18 =287.2;P <.001)。与其他阶段的用户相比,糖尿病前期的用户寻求更多的信息支持(P <.001),而 2 型糖尿病用户发布的类别没有显著差异(P >.001)。接受胰岛素治疗的 2 型糖尿病用户提供了更多的信息和情感支持(P <.001),而缓解期 2 型糖尿病用户比其他阶段的用户交换了更多的成就支持(P <.001)和网络支持(P <.001)。结论:这是第一项强调在糖尿病的不同阶段,不同类型的社会支持可能有益、如何有益以及何时有益的研究。多个利益相关者可能会从这些发现中受益,这些发现可能为如何战略性地使用和利用这些类别来支持糖尿病管理提供新的见解。
双光子荧光显微镜 (2PM) 的最新进展使得活体小鼠的血管网络大规模成像和分析成为可能。然而,提取密集毛细血管床的网络图和矢量表示仍然是许多应用中的瓶颈。血管矢量化在算法上很困难,因为血管具有多种形状和大小,样本通常光照不均匀,并且需要较大的图像体积才能获得良好的统计能力。最先进的三维血管矢量化方法通常需要分割(二值)图像,依赖于手动或监督机器注释。因此,逐体素图像分割会受到人类注释者或训练者的偏见。此外,分割图像通常需要在骨架化或矢量化之前进行补救形态学过滤。为了解决这些限制,我们提出了一种矢量化方法,可从未分割图像中直接提取血管对象,而无需机器学习或训练。 MATLAB 中的无分割自动化血管矢量化 (SLAVV) 源代码已在 GitHub 上公开提供。这种新方法使用简单的血管解剖模型、高效的线性滤波和矢量提取算法来消除图像分割要求,用手动或自动矢量分类取而代之。半自动化 SLAVV 在小鼠皮层微血管网络(毛细血管、小动脉和小静脉)的三个体内 2PM 图像体积上进行了演示。矢量化性能已被证明对于血浆或内皮标记对比度的选择具有稳健性,并且处理成本与输入图像体积成比例。全自动 SLAVV 性能在不同质量的模拟 2PM 图像上进行评估,所有图像均基于大(1.4 × 0.9 × 0.6 mm 3 和 1.6 × 10 8 体素)输入图像。从自动矢量化图像计算出的感兴趣的血管统计数据(例如体积分数、表面积密度)比从强度阈值图像计算出的统计数据具有更高的图像质量稳定性。
摘要。切除手术可能治愈药物抵抗性局灶性癫痫,但只有 40% 至 70% 的患者在手术后实现无癫痫发作。回顾性定量分析可以阐明切除结构和患者结果的模式,以改善切除手术。然而,必须首先在术后 MRI 图像上分割切除腔。卷积神经网络 (CNN) 是最先进的图像分割技术,但需要大量带注释的数据进行训练。医学图像的注释是一个耗时的过程,需要训练有素的评估者,并且通常存在较高的评估者间差异。自监督学习可用于从未标记的数据中生成训练实例。我们开发了一种算法来模拟术前 MRI 图像上的切除术。我们整理了一个新的数据集 EPISURG,其中包含 431 名接受切除手术的患者的 431 张术后 MRI 图像和 269 张术前 MRI 图像。除了 EPISURG,我们还使用了三个公共数据集(包含 1813 张术前 MRI 图像)进行训练。我们在训练期间动态创建的人工切除图像上训练了一个 3D CNN,使用的图像来自 1) EPISURG、2) 公共数据集和 3) 两者。为了评估训练好的模型,我们计算了模型分割和三位人工评估者执行的 200 个手动注释之间的 Dice 分数 (DSC)。使用带有手动注释的数据训练的模型获得的中位数(四分位距)DSC 为 65.3(30.6)。我们表现最好的模型的 DSC 是在没有手动注释的情况下训练的,为 81.7(14.2)。相比之下,人类注释者之间的评级者间一致性为 84.0 (9.9)。我们展示了一种使用模拟切除腔的 CNN 训练方法,该方法可以准确地分割真实的切除腔,而无需手动注释。