Loading...
机构名称:
¥ 1.0

大型语言模型(LLMS)在认可和分析人类言论,音乐和环境声音方面表现出色。然而,尽管有很大的科学兴趣,但他们理解其他类型的声音,尤其是生物医学声音的潜力仍然很大程度上。在这项研究中,我们专注于使用Phonocardiongons,即心脏声音诊断心血管疾病。大多数现有的深神经网络(DNN)范式仅限于心脏杂音分类(健康与不健康),并且不预测杂音的其他声学特征,例如时间,时间安排,评分,苛刻,音高和质量,这对于帮助医生可以帮助医生诊断出底层心脏状况很重要。我们建议在Physionet Circor digiscope Phonocardiogram(PCG)数据集上对Audio llm(Qwen2-audio)进行验证,并评估其在对11个专家标记的杂音特征进行分类时的性能。从事方面的目标,我们旨在通过使用音频表示模型Ssamba探索预处理细分算法来实现更多的噪声和可推广系统。我们的结果表明,基于LLM的模型在11个功能中的8个中优于最先进的方法,其余3个。更重要的是,LLM成功地将长尾杂音功能分类为有限的培训数据,这是所有以前的方法都无法分类的任务。这些发现强调了Audio LLM作为人类心脏病专家在增强心脏病诊断方面的助手的潜力。

在心脏杂音特征上探索填充的音频-LLM

在心脏杂音特征上探索填充的音频-LLMPDF文件第1页

在心脏杂音特征上探索填充的音频-LLMPDF文件第2页

在心脏杂音特征上探索填充的音频-LLMPDF文件第3页

在心脏杂音特征上探索填充的音频-LLMPDF文件第4页

在心脏杂音特征上探索填充的音频-LLMPDF文件第5页