Loading...
机构名称:
¥ 1.0

基础模型通过利用其预先训练的代表来捕获语音信号中的情感模式,在语音情感识别(SER)中表现出了巨大的希望。为了进一步提高各种语言和领域的SER性能,我们提出了一种新颖的方法。首先,我们收集了Emoset ++,这是一个全面的多语言,多种文化的语音情感语料库,具有37个数据集,150,907个类型,总持续时间为119.5小时。第二,我们介绍了exhubert,这是Hubert的增强版本,它是通过骨架扩展和对E Mo s et ++进行微调实现的。我们将每个编码器层及其权重填充,然后冻结第一个重复,集成了零零的线性层并跳过连接以保持功能并确保其适应性的能力,以便随后进行微调。我们在看不见的数据集上的评估显示了Exhubert的功效,为各种SER任务设定了新的基准标记。模型和有关E Mo S et ++的详细信息:https://huggingface.co/amiriparian/exhubert。索引术语:情感计算,语音情感识别,变形金刚,深度学习

Exhubert:通过块扩展加强休伯特,并在37个情绪数据集上进行微调

Exhubert:通过块扩展加强休伯特,并在37个情绪数据集上进行微调PDF文件第1页

Exhubert:通过块扩展加强休伯特,并在37个情绪数据集上进行微调PDF文件第2页

Exhubert:通过块扩展加强休伯特,并在37个情绪数据集上进行微调PDF文件第3页

Exhubert:通过块扩展加强休伯特,并在37个情绪数据集上进行微调PDF文件第4页

Exhubert:通过块扩展加强休伯特,并在37个情绪数据集上进行微调PDF文件第5页

相关文件推荐