摘要 — 我们提出了一个统一的深度学习框架,用于基于脑电图 (EEG) 信号识别用户身份和识别想象动作,以用作脑机接口。我们的解决方案利用一种新颖的移位子采样预处理步骤作为数据增强的形式,并使用矩阵表示来编码多电极 EEG 信号固有的局部空间关系。然后将生成的类似图像的数据输入到卷积神经网络以处理局部空间依赖性,并最终通过双向长短期记忆模块进行分析以关注时间关系。我们的解决方案与最先进的几种方法进行了比较,在不同任务上表现出相当或更优异的性能。具体而言,我们在动作和用户分类任务中都实现了 90% 以上的准确率。在用户识别方面,在已知用户和手势的情况下,我们的等错误率达到 0.39%,在更具挑战性的未知用户和手势的情况下,我们的等错误率达到 6.16%。我们还进行了初步实验,以便将未来的工作引导到依赖于一组精简的 EEG 电极的日常应用。
本研究的重点是利用脑电图信号为想象词提供一个简单、可扩展、多类的分类器。六个波斯语单词以及静默(或空闲状态)被选为输入类。这些单词可用于控制鼠标/机器人运动或填写简单的计算机表格。本研究的数据集是五名参与者在五次会话中收集的 10 条记录。每条记录重复了 20 次所有单词和静默。特征集由 1 至 32 Hz 频带中 19 个脑电图通道的归一化 1 Hz 分辨率频谱组成。二元 SVM 分类器组的多数规则用于确定特征集的相应类。通过蒙特卡洛交叉验证估计分类器的平均准确度和混淆矩阵。根据记录类间和类内样本的时间差异,定义了三种分类模式。在长时间模式下,即涉及整个数据库中单词的所有实例,单词-沉默的平均准确率约为 58%,单词-单词的平均准确率约为 60%,单词-单词-沉默的平均准确率约为 40%,七类分类(6 个单词+沉默)的平均准确率约为 32%。对于短时间模式,当仅使用相同记录的实例时,准确率分别为 96%、75%、79% 和 55%。最后,在混合时间分类中,每个类别的样本都来自不同的记录,平均准确率最高,约为 97%、97%、92% 和 62%。即使在长时间模式的最坏情况下,这些结果也明显优于随机结果,并且与该领域先前研究报告的最佳结果相当。
这似乎是一项艰巨的任务,它迫使那些花了一生时间学习一个领域的学者,再花一生的时间学习另一个领域。但是,虽然这种双重专业知识对于构建叙事人工智能至关重要,但它并不是构建人工智能的必要条件。我们需要辨别的基本事实是,故事和逻辑在不同的领域运作,前者必然是暂时的,后者本质上是永恒的。从这个事实出发,我们可以简单而明确地确定,计算机人工智能不能读写——也永远不能读写——小说或任何其他类型的叙事,包括剧本、短篇小说、人物对话、政治演讲、商业计划、科学假设、技术提案、军事战略和征服全球的阴谋。
摘要 —脑机接口 (BCI) 是一种通过反映人的状态和意图来实现人与设备之间通信的技术。在进行想象语音时,用户会想象发音就像实际说话一样。在解码基于想象语音的脑电信号的情况下,可以更直观地执行复杂任务,但解码性能低于其他 BCI 范式。我们修改了之前的模型来解码基于想象语音的脑电信号。十名受试者参加了实验。我们提出的方法对四个单词进行分类的平均准确率为 0.5648(±0.0197)。换句话说,我们提出的方法在学习局部特征方面具有显著的优势。因此,我们证明了以稳健的性能解码基于想象语音的脑电信号的可行性。
摘要:用脑电图(EEG)信号使用想象的语音是脑部计算机界面(BCI)的有前途的场,它寻求与语言和设备或机器相关的脑皮质区域之间的通信。然而,这种大脑过程的复杂性使这类信号的分析和分类是相关的研究主题。这项研究的目标是:开发一种基于深度学习(DL)的新算法,称为CNNEEG1-1,以识别想象中的元音任务中的脑电图信号;创建一个想象中的语音数据库,其中50个主题专门从事西班牙语(/a/,/e/,/i/,/,/o/,/u/)的想象元音;并使用开放访问数据库(BD1)以及新开发的数据库(BD2)将CNNEEG1-1算法的性能与DL浅CNN和EEGNET基准算法的性能进行对比。在这项研究中,进行了方差的混合方差分析,以评估所提出算法的受试者内和受试者间训练。结果表明,对于受主体内的训练分析,浅CNN,EEGNET和CNNEEG1-1的最佳性能在对想象中的元音(/a/a/a,/e/,/i/,/i/,/o/,/u/)进行分类时,由CNNEEG1-1展出,由CNNEEG1-1展示为65.62%的cnneeg1-1 data for bd and bd and bd and and bd and and bd and and bd bdse ands的55份数为89%。
摘要我们提出了一种基于转移学习的方法,用于解码电子脑力图(EEG)的想象语音。特征是从多个EEG通道同时提取的,而不是与单个通道分开提取。这有助于捕获皮质区域之间的相互关系。为了减轻缺乏足够数据来训练深层网络的问题,可以执行基于窗口的数据增强。平均相干性和幅度方相干性,用作EEG连通性分析中使用的两种流行措施,用作特征。这些特征是紧凑的,利用它们的对称性,以获得三维“图像样”表示。该矩阵的三个维度对应于alpha,beta和伽马eeg频带。具有RESNET50的深层网络,因为基本模型用于对想象的提示进行分类。所提出的方法已在想象中的语音脑电图的公开可用的ASU数据集上进行了测试,其中包括四种不同类型的提示。解码想象的提示的准确性从元音的最低79.7%,到整个主题的长时间单词最多95.5%。所获得的精度优于状态方法,并且该技术在解码不同复杂性的提示方面非常好。
音乐感知需要人脑处理各种声学和音乐相关特性。最近的研究使用编码模型来梳理和研究影响音乐感知的各种皮质因素。为此,这些方法研究了总结几分钟数据内神经活动的时间响应函数。在这里,我们测试了使用脑电图 (EEG) 评估单个音乐单元(小节)神经处理的可能性。我们设计了一种基于 EEG 段间最大相关性度量 (maxCorr) 的解码方法,并根据一项实验使用它来解码 EEG 中的旋律。在该实验中,专业音乐家多次聆听和想象四个巴赫旋律。我们在此证明,从聆听和想象期间记录的 EEG 信号中,可以准确解码单个受试者和单个音乐单元的旋律。此外,我们发现 maxCorr 方法的解码准确度高于基于后向时间响应函数 (bTRF env) 的包络重建方法。这些结果表明,低频神经信号编码的信息超出了音符时间,尤其是低于 1 Hz 的低频皮质信号,这些信号被证明可以编码与音高相关的信息。除了这些结果的理论意义外,我们还讨论了这种解码方法在新型脑机接口解决方案中的潜在应用。
摘要 — 人工智能 (AI) 工具和技术在社会中越来越普遍。许多青少年每天都会与 AI 设备互动,但通常对 AI 的工作原理以及它对社会的更广泛影响的理解有限。培养年轻人对 AI 的理解、培养道德意识和支持不同年轻人追求计算机科学至关重要,以帮助确保未来开发更公平的 AI 技术。在这里,我们分享了我们为中学生开发和远程促进跨学科 AI 伦理计划的经验,旨在提高青少年对 AI 及其社会影响的认识和理解。学生讨论了包含道德困境的故事,参与了 AI 媒体和模拟,并创建了数字产品来表达他们对 AI 伦理问题的立场。在正式和非正式环境中的四次迭代中,我们发现学生参与了 AI 故事并投入到学习 AI 及其社会影响中。短篇故事能够有效地提高人们的认识,集中讨论,并帮助学生对公平、偏见和隐私等人工智能伦理问题形成更细致的理解。