Loading...
机构名称:
¥ 1.0

摘要:神经语音解码驱动的脑机接口 (BCI) 或语音 BCI 是一种探索闭锁症 (完全瘫痪但有意识) 患者交流恢复的新范例。语音 BCI 旨在将神经信号直接转换为文本或语音,这有可能比当前的 BCI 实现更高的通信速率。尽管最近的进展已经证明了语音 BCI 的潜力,无论是侵入式还是非侵入式神经信号,但迄今为止开发的大多数系统仍然假设知道连续神经记录中语音话语的开始和结束。缺乏实时语音/语音活动检测 (VAD) 是神经语音解码未来应用的当前障碍,其中 BCI 用户可以与其他说话者进行连续对话。为了解决这个问题,在本研究中,我们尝试直接从使用脑磁图 (MEG) 记录的神经信号中自动检测语音/语音活动。首先,我们使用支持向量机 (SVM) 对神经信号中的语音前、语音和语音后整个片段进行分类。其次,对于连续预测,我们使用长短期记忆循环神经网络 (LSTM-RNN) 通过其顺序模式学习机制有效地解码每个时间点的语音活动。实验结果表明,直接从非侵入性神经信号进行实时 VAD 的可能性约为 88%。

NeuroVAD:非实时语音活动检测...

NeuroVAD:非实时语音活动检测...PDF文件第1页

NeuroVAD:非实时语音活动检测...PDF文件第2页

NeuroVAD:非实时语音活动检测...PDF文件第3页

NeuroVAD:非实时语音活动检测...PDF文件第4页

NeuroVAD:非实时语音活动检测...PDF文件第5页

相关文件推荐

2022 年
¥2.0