Loading...
机构名称:
¥ 1.0

由于合成语音的感知音频质量可能决定系统的市场成功,因此质量评估至关重要。音频质量评估通常以主观或客观的方式进行。由于成本高昂且耗时,主观方法通常已被更快、更具成本效益的客观方法所取代。客观方法的主要缺点主要是它们缺乏对获得主观质量感知至关重要的人为影响因素。然而,它不能直接观察到并体现在个体大脑活动中。因此,我们结合了单个受试者脑电图 (EEG) 信息和音频特征的预测,以改进对合成语音整体质量的预测。我们的结果表明,通过结合音频和 EEG 模型的结果,一个非常简单的神经网络可以超越单模态方法的性能。索引词:EEG、文本到语音、质量预测、后期整合

结合音频和大脑活动来预测语音质量

结合音频和大脑活动来预测语音质量PDF文件第1页

结合音频和大脑活动来预测语音质量PDF文件第2页

结合音频和大脑活动来预测语音质量PDF文件第3页

结合音频和大脑活动来预测语音质量PDF文件第4页

结合音频和大脑活动来预测语音质量PDF文件第5页

相关文件推荐