脑机接口 (BCI) 是一种新兴的交互式通信方法,通过解码大脑活动产生的信号,实现对假肢和外部设备的神经控制,以及中风后运动康复。这种最先进的技术有可能彻底改变生活的各个方面,并显着提高整体生活质量。BCI 具有广泛的应用范围,从医疗援助到人类增强(Ahmed 等人,2022 年;Altaheri 等人,2023 年)。通常,脑电图 (EEG) 信号反映大脑的电活动,并通过在头皮上放置电极阵列来非侵入式地记录。获得真实值(时间和通道)二维 EEG 信号矩阵使人与外部设备之间的直接通信成为可能(Graimann 等人,2010 年)。运动想象 (MI) 是一种思考如何移动身体的某个部位而不移动身体的活动。基于 EEG 的 MI 活动已广泛应用于车辆控制、无人机控制、环境控制、智能家居、安全和其他非医疗领域(Altaheri 等人,2023 年)。然而,解码 MI-EEG 信号仍然是一项具有挑战性的任务。在此任务中,其他生理信号(例如面部肌肉活动、眨眼和环境中的电磁干扰)会污染记录的 MI-EEG 信号并导致信噪比低(Lotte 等人,2018 年)。MI-EEG 模式的个体差异受到参与者大脑结构和功能差异的影响。此外,EEG 系统在信号通道之间表现出一定程度的相关性,这进一步使信号处理过程复杂化(Altaheri 等人,2022 年)。在对 EEG 信号进行分类和识别的传统方法中,通常依赖于领域特定知识。这导致人们更加关注开发有效的特征提取和分类技术,这主要是由于 EEG 信号固有的低信噪比( Huang et al., 2019 )。人们通常使用各种特征提取方法,包括独立成分分析( Barbati et al., 2004 ; Delorme and Makeig, 2004 ; Porcaro et al., 2015 ; Ruan et al., 2018 )、小波变换( Xu et al., 2018 )、共同空间模式( Gaur et al., 2021 )和经验模态分解( Tang et al., 2020 )。在对 EEG 信号进行预处理后,从处理后的信号中提取基本特征并输入分类器以确定输入实例的类别( Vaid et al., 2015 )。传统的特征提取方法通常涉及手工设计的特征提取器,例如滤波器组共享空间模式 (FBCSP) (Ang et al., 2008) 或黎曼协方差 (Hersche et al., 2018) 特征。Ang et al.(2012)使用滤波器组公共空间模式(FBCSP)算法来优化MI-EEG上公共空间模式(CSP)的受试者特定频带,然后采用基于互信息的最佳个体特征(MIBIF)算法和基于互信息的粗糙集约简(MIRSR)算法从信号中提取判别性的CSP特征。最后,我们使用CSP算法进行分类并获得了良好的性能。值得注意的是,所有这些步骤都非常耗时。虽然传统方法通过预处理方法提高了EEG信号的信噪比,但从不同时间戳和受试者采集的EEG信号通常
目标:我们使用深度卷积神经网络 (DCNN) 对基于稳态视觉诱发电位 (SSVEP) 的单通道脑机接口 (BCI) 中的脑电图 (EEG) 信号进行分类,该接口不需要用户进行校准。方法:EEG 信号被转换为频谱图,并作为输入,使用迁移学习技术训练 DCNN。我们还修改并应用了一种通常用于语音识别的数据增强方法 SpecAugment。此外,为了进行比较,我们使用支持向量机 (SVM) 和滤波器组典型相关分析 (FBCCA) 对 SSVEP 数据集进行了分类。结果:从微调过程中排除评估用户的数据后,我们使用较小的数据长度(0.5 秒)、仅一个电极(Oz)和具有迁移学习、窗口切片(WS)和 SpecAugment 时间掩码的 DCNN,对来自开放数据集的 35 名受试者实现了 82.2% 的平均测试准确率和 0.825 的平均 F1 分数。结论:使用单个电极和较小的数据长度,DCNN 结果优于 SVM 和 FBCCA 性能。迁移学习提供的准确率变化很小,但使训练速度更快。SpecAugment 实现了小幅性能改进,并成功与 WS 结合,获得了更高的准确率。意义:我们提出了一种使用 DCNN 解决 SSVEP 分类问题的新方法。我们还修改了语音识别数据增强技术并将其应用于 BCI 环境中。所提出的方法在数据长度较小且只有一个电极的 BCI 中超越了 FBCCA 和 SVM(更传统的 SSVEP 分类方法)所获得的性能。这种类型的 BCI 可用于开发小型快速系统。
* 共同第一作者 1 麻省理工学院麦戈文脑研究所脑与认知科学系,美国马萨诸塞州剑桥 2 麻省理工学院大脑、心智与机器中心,美国马萨诸塞州剑桥 3 哈佛大学语音与听觉生物科学与技术项目,美国马萨诸塞州剑桥 4 罗彻斯特大学医学中心,美国纽约州罗彻斯特 摘要 深度神经网络通常用作视觉系统的模型,但在听觉方面的研究较少。先前的研究提供了音频训练神经网络的例子,这些网络可以很好地预测听觉皮层 fMRI 反应,并显示出模型阶段与大脑区域之间的对应关系,但这些结果是否推广到其他神经网络模型尚不清楚。我们评估了公开可用的音频神经网络模型以及在四个不同任务上训练的内部模型的大脑模型对应关系。大多数测试模型的预测效果都优于之前的听觉皮层滤波器组模型,并表现出系统的模型-大脑对应关系:中间阶段最能预测初级听觉皮层,而深层阶段最能预测非初级皮层。然而,一些最先进的模型产生了明显更差的大脑预测。训练任务影响了特定皮质调节特性的预测质量,最好的整体预测来自在多个任务上训练的模型。结果表明任务优化在限制大脑表征方面的重要性。
摘要:目前,脑电图 (EEG) 解码任务中的最佳性能通常通过深度学习 (DL) 或基于黎曼几何的解码器 (RBD) 实现。最近,人们对深度黎曼网络 (DRN) 的兴趣日益浓厚,它可能结合了前两类方法的优势。然而,仍然有一系列主题需要额外的洞察力,为 DRN 在 EEG 中的更广泛应用铺平道路。这些包括架构设计问题,例如网络大小和端到端能力。这些因素如何影响模型性能尚未探索。此外,尚不清楚这些网络中的数据是如何转换的,以及这是否与传统的 EEG 解码相关。我们的研究旨在通过分析具有广泛超参数的 EEG DRN,为这些主题领域奠定基础。在五个公共 EEG 数据集上测试了网络,并与最先进的 ConvNets 进行了比较。在这里,我们提出了端到端 EEG SPDNet(EE(G)-SPDNet),并且我们表明这种宽的端到端 DRN 可以胜过 ConvNets,并且在这样做时使用生理上合理的频率区域。我们还表明,端到端方法比针对 EEG 的经典 alpha、beta 和 gamma 频带的传统带通滤波器学习更复杂的滤波器,并且性能可以从特定于通道的滤波方法中受益。此外,架构分析揭示了进一步改进的地方,因为整个网络可能未充分利用黎曼特定信息。因此,我们的研究展示了如何设计和训练 DRN 以从原始 EEG 推断与任务相关的信息,而无需手工制作的滤波器组,并强调了端到端 DRN(如 EE(G)-SPDNet)用于高性能 EEG 解码的潜力。
离散小波变换 (DWT) 通常由迭代滤波器组实现;因此,对于恒定个数的零矩,在时间局部化方面可以观察到离散时间基的优化缺失。本文讨论并介绍了一种用于特征提取的改进形式的 DWT,称为斜波变换 (SLT),以及中智学(模糊逻辑的概括,是一种相对较新的逻辑)。因此,一种新的复合 NS-SLT 模型已被提出作为获取统计纹理特征的来源,用于识别脑肿瘤的恶性程度。使用三个成员集(真 (T)、假 (F) 和不确定 (I))来定义中智域中的 MRI 图像;然后,将 SLT 应用于每个成员集。使用三种基于统计测量的方法从脑部 MRI 图像中提取纹理特征。单因素方差分析已被用于减少分类器提取特征的数量;然后,将提取的特征提供给四种神经网络分类技术,支持向量机神经网络(SVM-NN)、决策树神经网络(DT-NN)、K最近邻神经网络(KNN-NN)和朴素贝叶斯神经网络(NB-NN),以预测脑肿瘤的类型。同时,通过计算平均准确度、精确度、灵敏度、特异度和接收者操作特性(ROC)曲线的曲线下面积(AUC)来评估所提出模型的性能。实验结果表明,当使用从复合 NS-SLT 技术得出的灰度运行长度矩阵 (GLRLM) 特征时,所提出的方法对于诊断脑肿瘤非常准确和有效。
在本研究中,我们提出了一种用于基于稳态视觉诱发电位 (SSVEP) 的脑机接口 (BCI) 的新型混合视觉刺激,该刺激将各种周期性运动融入传统的闪烁刺激 (FS) 或模式反转刺激 (PRS)。此外,我们研究了每种 FS 和 PRS 的最佳周期运动,以增强基于 SSVEP 的 BCI 的性能。通过根据四个不同的时间函数(用无、平方、三角和正弦表示)改变刺激的大小来实现周期性运动,总共产生八种混合视觉刺激。此外,我们开发了滤波器组典型相关分析 (FBCCA) 的扩展版本,这是一种用于基于 SSVEP 的 BCI 的最先进的无需训练分类算法,可提高基于 PRS 的混合视觉刺激的分类准确性。 20 名健康个体参加了基于 SSVEP 的 BCI 实验,以区分四种不同频率的视觉刺激。评估了平均分类准确率和信息传输率 (ITR),以比较基于 SSVEP 的 BCI 对不同混合视觉刺激的性能。此外,还评估了用户对每种混合视觉刺激的视觉疲劳程度。结果,对于 FS,当除 3 秒外的所有窗口大小都加入正弦波形的周期运动时,报告的性能最高。对于 PRS,方波的周期运动在所有测试窗口大小中显示出最高的分类准确率。两种最佳刺激之间的性能没有观察到显著的统计差异。据报道,正弦波周期运动的 FS 和方波周期运动的 PRS 的平均疲劳分数分别为 5.3 ± 2.05 和 4.05 ± 1.28。因此,我们的结果表明,与传统的 FS 和 PRS 相比,具有正弦波周期运动的 FS 和具有方波周期运动的 PRS 可以有效提高 BCI 性能。
驾驶员疲劳检测是减少事故、提高交通安全的重要手段之一,其主要挑战在于如何准确识别驾驶员的疲劳状态。现有的检测方法包括基于面部表情和生理信号的打哈欠、眨眼等,但基于面部表情的检测结果会受到光照和环境影响,而脑电信号是直接反应人的精神状态的生理信号,对检测结果的影响较小。本文提出一种基于EEG的对数梅尔语谱图和卷积循环神经网络(CRNN)模型来实现驾驶员疲劳检测,这种结构可以发挥不同网络的优势,克服单独使用各个网络的劣势。其流程为:首先将原始脑电信号经过一维卷积的方法实现短时傅里叶变换(STFT),并经过梅尔滤波器组得到对数梅尔谱图,然后将得到的对数梅尔谱图输入到疲劳检测模型中,完成脑电信号的疲劳检测任务。疲劳检测模型由6层卷积神经网络(CNN)、双向循环神经网络(Bi-RNN)和分类器组成。在建模阶段,将谱图特征输送到6层CNN自动学习高级特征,从而在双向RNN中提取时间特征,得到谱图-时间信息。最后,通过由全连接层、ReLU激活函数和softmax函数组成的分类器得到警觉或疲劳状态。本研究的实验是在公开可用的数据集上进行的。结果表明,该方法能够准确区分警觉与疲劳状态,且稳定性较高;此外,还将四种现有方法的性能与本文方法的结果进行了比较,均表明本文方法能够取得目前为止的最好效果。
* 共同第一作者 1 麻省理工学院麦戈文脑研究所脑与认知科学系,美国马萨诸塞州剑桥 2 麻省理工学院大脑、心智与机器中心,美国马萨诸塞州剑桥 3 哈佛大学言语与听觉生物科学与技术项目,美国马萨诸塞州剑桥 4 罗彻斯特大学医学中心,美国纽约州罗彻斯特 摘要 预测大脑对刺激的反应的模型提供了对感觉系统的一种理解,并且在科学和工程领域有许多潜在的应用。因此,刺激可计算的感觉模型是神经科学的长期目标。深度神经网络已成为视觉系统的主要预测模型,但在听觉领域的研究较少。先前的研究提供了音频训练神经网络的例子,这些网络可以很好地预测听觉皮层 fMRI 反应,并表现出模型阶段和大脑区域之间的对应关系,但尚不清楚这些结果是否能推广到其他神经网络模型,以及如何进一步改进该领域的模型。我们评估了公开可用的音频神经网络模型以及在四个不同任务上训练的内部模型的大脑模型对应性。大多数测试模型的预测结果都优于之前的听觉皮层滤波器组模型,并表现出系统的模型-大脑对应性:中间阶段最能预测初级听觉皮层,而深层阶段最能预测非初级皮层。然而,一些最先进的模型产生了明显更差的大脑预测。训练任务影响了特定皮层调节特性的预测质量,最佳整体预测来自在多个任务上训练的模型。结果表明任务优化对于解释大脑表征的重要性,并普遍支持深度神经网络作为听觉模型的前景。
* 共同第一作者 1 麻省理工学院麦戈文脑研究所脑与认知科学系,美国马萨诸塞州剑桥 2 麻省理工学院大脑、心智与机器中心,美国马萨诸塞州剑桥 3 哈佛大学言语与听觉生物科学与技术项目,美国马萨诸塞州剑桥 4 罗彻斯特大学医学中心,美国纽约州罗彻斯特 摘要 预测大脑对刺激的反应的模型提供了对感觉系统的一种理解,并且在科学和工程领域有许多潜在的应用。因此,刺激可计算的感觉模型是神经科学的长期目标。深度神经网络已成为视觉系统的主要预测模型,但在听觉领域的研究较少。先前的研究提供了音频训练神经网络的例子,这些网络可以很好地预测听觉皮层 fMRI 反应,并表现出模型阶段和大脑区域之间的对应关系,但尚不清楚这些结果是否能推广到其他神经网络模型,以及如何进一步改进该领域的模型。我们评估了公开可用的音频神经网络模型以及在四种不同任务上训练的内部模型的模型-大脑对应关系。大多数测试模型的预测结果都优于之前的听觉皮层滤波器组模型,并表现出系统的模型-大脑对应关系:中间阶段最能预测初级听觉皮层,而深层阶段最能预测非初级皮层。然而,一些最先进的模型产生了明显更差的大脑预测。在干净语音(未添加背景噪音)上训练的模型产生了更差的大脑预测,这可能是因为在噪音中听觉对生物听觉表征施加了限制。训练任务影响了特定皮层调节属性的预测质量,在多项任务上训练的模型产生的最佳整体预测。结果普遍支持深度神经网络作为听觉模型的前景,但它们也表明当前的模型不能完全解释听觉皮层反应。