摘要 — 自动语音识别 (ASR) 界面在日常生活中越来越受欢迎,用于电子设备的交互和控制。当前使用的界面不适用于各种用户,例如患有言语障碍、闭锁综合症、瘫痪或对隐私有极高要求的用户。在这种情况下,可以使用脑电图 (EEG) 信号识别设想语音的界面可以带来很大的好处。过去已经针对这个问题进行了各种研究。然而,在识别有助于设想语音识别的 EEG 信号频带 (δ、θ、α、β、γ) 方面工作有限。因此,在这项工作中,我们旨在分析从大脑不同叶获得的不同 EEG 频带和信号的重要性及其对识别设想语音的贡献。从不同叶瓣获得的信号以及针对不同频带进行带通滤波的信号被输入到具有卷积神经网络 (CNN) 和长短期记忆 (LSTM) 的时空深度学习架构中。性能评估基于一个公开可用的数据集,该数据集包含三个分类任务 - 数字、字符和图像。我们对这三个任务的分类准确率分别为 85.93%、87.27% 和 87.51%。实现代码已在 https://github.com/ayushayt/ImaginedSpeechRecognition 上提供。索引术语 - 设想语音、EEG、CNN、LSTM、频带、脑机接口
主要关键词