言语和语言技术是确定与帕金森氏病(PD)相关的不同语音变化的有效工具,可以早期,更准确地诊断。自我监管的语音预审查的最新进展,尤其是使用WAV2VEC模型,表现出了比传统特征提取方法优越的性能。虽然已成功用于PD检测WAV2VEC 2.0,但需要与WAV2VEC 1.0进行严格的定量比较,以全面评估其在PD中不同语音模式的优势,局限性和适用性。这项研究对三个多语言数据集的WAV2VEC 1.0和WAV2VEC 2.0嵌入的系统比较,使用各种分类方法进行分类(健康对照; HC)和PD语音。此外,两个WAV2VEC版本都针对各种语言环境的传统基线特征进行了基准测试,包括自发的语音,非自发的语音和孤立的元音。采用了多准则的TOPSIS方法来对特征提取方法进行排名,这表明WAV2VEC 2.0在所有语音模式中都始终如一地表现出色,其第一个变压器层展示了上下文任务的最佳性能(阅读文本和独白)及其特征提取器在基于Vowel的分类中表现最佳。相比之下,WAV2VEC 1.0虽然通常超过WAV2VEC 2.0的表现,但在上下文任务中仍然提供了具有竞争性能的替代方案,突出了其对特定应用的潜力,例如联合学习。此比较分析进一步强调了每个WAV2VEC架构的优势,并为它们在PD检测中的最佳使用提供了信息。
主要关键词