图 1:将语言处理的人工神经网络模型与大脑语言网络的活动进行比较。我们测试了不同模型预测人类在语言理解过程中神经活动测量值的能力。候选模型包括简单的嵌入模型、更复杂的循环和变压器网络。刺激包括句子、段落和故事,并且 1) 输入模型,2) 呈现给人类参与者(视觉或听觉)。然后,1) 从模型中捕获由此产生的内部表征,2) 使用 fMRI 或 ECoG 从人类那里记录下来。为了比较模型和人类表征,我们对 80% 的刺激的相应人类测量值对模型表征进行了回归,然后将模型对保留的 20% 刺激的预测与保留的人类数据进行比较,并使用 Pearson 相关性(交叉验证 5 倍),得出每个模型数据对的相似度分数。
主要关键词