背景:帕金森病 (PD) 是一种常见的神经退行性疾病,影响着全世界 700 万至 1000 万人。目前尚无针对 PD 的客观测试,研究表明误诊率高达 34%。机器学习 (ML) 提供了改善诊断的机会;然而,数据集的大小和性质使得很难将 ML 模型的性能推广到实际应用中。目标:本研究旨在巩固前期工作,并引入基于元音发声的诊断特征工程和 ML 新技术。引入了额外的特征和 ML 技术,在大型 mPower 发声数据集上显示出显著的性能改进。方法:我们使用从整个数据集中随机选择的 1600 个 /aa/ 发声样本来推导从数据集中过滤出错误样本的规则。应用这些规则以及联合年龄-性别平衡过滤器,得到一个包含 511 名 PD 患者和 511 名对照者的数据集。我们从 1 秒开始,针对 1.5 秒的音频窗口计算支持向量机的特征。使用 10 倍交叉验证 (CV) 对此进行评估,并分层以平衡每个 CV 倍的患者和对照数量。结果:我们表明,先前文献中使用的特征在推断到更大的 mPower 数据集时表现不佳。由于语音的自然变化,患者和对照的分离并不像以前认为的那么简单。我们在使用其他新特征(确定性为 88.6%,来自贝叶斯相关 t 检验)分离患者和对照方面表现出显着的性能改进,准确率超过 58%。结论:结果令人鼓舞,展示了 ML 在检测神经科医生无法察觉的症状方面的潜力。
主要关键词