Loading...
机构名称:
¥ 1.0

脑电图 (EEG) 是一种非侵入性测量人脑电活动的方法。EEG 传感器被放置在受试者的头皮上以获取 EEG 记录。参考文献 [1]–[3] 表明,EEG 特征可用于执行孤立和连续语音识别,其中受试者说话或聆听时记录的 EEG 信号使用自动语音识别 (ASR) 模型转换为文本。在 [4] 中,作者展示了使用深度学习模型从侵入性皮层脑电图 (ECoG) 信号合成语音。同样,在 [2]、[5] 中,作者展示了使用深度学习模型从 EEG 信号合成语音。在 [2]、[5] 中,作者展示了使用不同类型的 EEG 特征集的结果。使用 EEG 特征进行语音合成和语音识别可能有助于有语言障碍的人或无法说话的人恢复语音。在本文中,我们感兴趣的是研究是否有可能从声学特征预测 EEG 特征。这个问题可以表述为基于 EEG 的语音合成的逆问题。在基于脑电图的语音合成中,声学特征是根据脑电图特征预测的,如参考文献 [2]、[5] 中所述。从独特的声学模式预测脑电图特征或特征可能有助于更好地理解人类大脑如何处理语音感知和产生。在实验室中记录脑电图信号是一项耗时且昂贵的工作

根据声学特征生成脑电图特征

根据声学特征生成脑电图特征PDF文件第1页

根据声学特征生成脑电图特征PDF文件第2页

根据声学特征生成脑电图特征PDF文件第3页

根据声学特征生成脑电图特征PDF文件第4页

根据声学特征生成脑电图特征PDF文件第5页