摘要 语音脑机接口 (BCI) 可将脑信号转换成口语单词或句子,已显示出高性能 BCI 通信的巨大潜力。音素是大多数语言发音的基本单位。现有的语音 BCI 主要集中在英语,其中单词包含多种音素组合,而中文普通话是一种单音节语言,单词通常由辅音和元音组成。这一特点使得通过直接从神经信号解码音素来开发高性能普通话语音 BCI 成为可能。本研究旨在使用皮层内神经信号解码口语普通话音素。我们观察到发音相似的音素通常由不可分割的神经模式表示,导致音素解码混乱。这一发现表明口语音素的神经表征具有层次结构。为了解释这一点,我们提出在双曲空间中学习音素发音的神经表征,其中层次结构可以更自然地优化。使用中国参与者的皮层内神经信号进行的实验表明,所提出的模型从神经信号中学习了具有判别性和可解释性的分层音素表示,显著提高了中文音素解码性能并达到了最佳水平。研究结果证明了基于音素解码构建高性能中文语音 BCI 的可行性。