痴呆症是一种常见的脑部疾病,对个人和社会都有负面影响。本文涉及使用 Interspeech 2020 的自发语音 (ADReSS) 挑战赛对阿尔茨海默氏痴呆症进行分类。我们使用 (1) VGGish(一种深度预训练的 Tensorflow 模型)作为音频特征提取器,并使用 Scikit-learn 分类器来检测语音中的痴呆症迹象。三个分类器(LinearSVM、Perceptron、1NN)的准确率为 59.1%,比在挑战赛中使用的声学特征上训练的最佳基线模型高出 3%。我们还提出了 (2) DemCNN,这是一种新的基于 PyTorch 原始波形的卷积神经网络模型,准确率为 63.6%,比表现最佳的基线线性判别分析模型准确率高出 7%。我们发现,使用预训练的 VGGish 特征提取器的音频迁移学习比使用自动提取的声学特征的基线方法表现更好。我们的 DepCNN 表现出良好的泛化能力。本文介绍的两种方法都为通过自发语音进行新的、创新的、更有效的基于计算机的痴呆症筛查提供了进展。
主要关键词