摘要 - 世界许多地区无法获得心脏病资源的访问促使基于心脏信号的自动诊断系统的发展。近年来,已经提出了广泛的监督学习模型,可以从心脏声音中最初诊断为心脏病。为了达到高精度,这种监督的学习模型通常需要大量标记的数据,这可能是昂贵的。在这方面,最近已经采用了自我监督的学习来减少对注释数据的过度依赖。wav2Vec 2.0是一种音频自我监督的学习模型,在各种与语音有关的任务中显示出令人鼓舞的结果。在本文中,我们对WAV2VEC 2.0进行了调整,以从心脏声音信号中进行杂音检测。为此,我们在Circor Digiscope Heart Sound数据集上进行了预训练和微调。结果证实了使用WAV2VEC 2.0模型进行心脏声音分类的可行性。该模型通过实现0.80的加权精度和0.70的UAR来显示出竞争性能,用于在保留测试集中进行杂音检测。为了研究微调数据大小对下游性能的影响,我们还对小规模的带注释数据进行了微调2VEC 2.0模型。结果证实,该模型对小型微调数据大小具有鲁棒性,因此可以减少我们对大型,带注释的心脏声音数据的依赖。索引术语 - 心脏声音,杂音检测,WAV2VEC 2.0,自我监督学习
主要关键词