人类学习世界内部模型,以支持复杂环境中的计划和概括。然而,尚不清楚如何在大脑中代表和学习这种内部模型。我们使用基于理论的增强学习来解决这个问题,这是一种基于模型的增强学习形式,其中模型是一种直观的理论。我们分析了来自人类参与者的fMRI数据,学习玩Atari风格的游戏。我们在前额叶皮层和额叶皮层,枕皮层和梭状回中的理论更新中发现了理论表示的证据。理论更新与理论表示的瞬时加强一致。理论更新期间的有效连通性表明,信息从前额叶理论编码区域流向后理论更新区域。一起,我们的结果与神经结构一致,在该神经体系结构中,自上而下的理论表示形式源于前额叶区域的视觉区域中的感觉预测,在该区域中,计算出符合理论预测错误并触发理论的自下而上的更新。