摘要。如今,情绪识别和分类在人机交互 (HCI) 领域发挥着至关重要的作用。情绪通过面部表情、语调和身体运动等身体行为来识别。本研究将语音情绪识别 (SER) 视为识别情绪的最主要方式之一。SER 数据集包含四个不同的数据集,本项目使用 Ravdess 数据集。使用这种机制是因为其时间分辨率高、无风险且成本低。在过去的几十年里,许多研究人员按顺序使用 SER 信号来配合脑机接口 (BCI) 来检测情绪。它包括从音频信号中去除噪声、从音频信号中提取时间或频谱特征、分别在时域或频域上进行分析,最后设计多类分类策略。本文讨论了基于音频信号识别和分类人类情绪的方法。该方法使用机器学习技术,如随机森林 (RF)、多层感知器 (MLP)、支持向量机 (SVM)、卷积网络 (CNN) 和决策树 (DT) 模型进行分类。获得的实验结果似乎很有希望,在情感分类方面具有良好的准确性。
主要关键词