脑机接口可以让失去说话能力的人通过从神经活动中解码预期语音来有效地交流。目前最先进的模型利用循环神经网络将神经活动映射到音素序列,利用维特比算法将音素序列映射到文本,先验概率由大型语言模型给出。我假设这些系统可以通过以下方式得到改进:(a) 识别能够很好地描述日常语音中使用的文本分布的预训练语言模型,(b) 使用转换器而不是 RNN 将神经活动映射到音素。令人惊讶的是,我发现在总机语料库上训练的简单三元语言模型在捕捉口语的统计特性方面优于预训练的大型语言模型。不幸的是,用各种转换器架构替换 RNN 并没有提高神经活动到音素系统的性能。总之,这些结果表明,先验语言模型的原则性选择有可能改善通信神经假体。