将颅内大脑活动直接综合到声学语音可能为语音受损的用户提供直观而自然的沟通手段。在先前的研究中,我们使用了对数MEL量表语音谱图(LogMels)作为从电型(ECOG)记录到可听见波形的解码中的中间表示。mel-scar的语音谱图具有悠久的传统。过去,由于连续的特征空间,我们依靠回归方法来发现从大脑活动到LogMel光谱系数的映射。但是,回归任务是无限的,因此在综合声音语音信号中,脑活动中的神经元爆发可能导致异常高幅度。为了减轻这些问题,我们提出了两种量化功率值的方法,以分别使用中位数和逻辑公式分别降低复杂性和限制间隔的数量,从而分别使用中值和逻辑公式来离散对数的光谱系数的特征空间。我们通过基于线性判别分析的简单分类来评估一个参与者的概念证明,并评估了一个参与者,并通过原始语音限制了由此产生的波形。重构频谱图实现了Pearson相关系数,平均值为r = 0。5±0。11中的5倍交叉验证。索引术语:语言交流,语音合成,电代理,BCI
主要关键词