方法:在本文中,我们提出了基于抑郁症检测模型的视觉和音频(DEPITCM)的多任务表示学习。该模型包括三个主要模块:数据预处理模块,Inpection-Permotal-Channel-Channel-Channel主体组件分析模块(ITCM Encoder)和多级学习模块。为了有效地从音频和视频数据中提取丰富的特征表示,ITCM编码器采用了分阶段的特征提取策略,从全球过渡到本地特征。这种方法可以捕获全局特征,同时在详细信息中强调时间,频道和空间信息的融合。此外,受到多任务学习策略的启发,本文通过合并次要任务(回归任务)来提高整体绩效,从而增强了抑郁症分类的主要任务。
主要关键词