生物大脑的学习速度比标准深度神经网络强化学习算法快得多。其中一个原因是深度神经网络需要学习适合手头任务的表示,而生物系统已经拥有合适的表示。在这里,我们通过在神经网络上施加基于生物学中观察到的表示(例如网格细胞)来绕过这个问题。本研究探讨了使用受生物启发的网格细胞表示与独热表示对基于时间差异的 Actor-Critic 网络学习解决简单的 2D 网格世界强化学习任务的速度的影响。结果表明,使用网格细胞确实可以促进更快的学习。此外,这里实现的网格细胞具有准确表示无界连续空间的潜力。因此,它们在这个离散任务上的出色表现是探索它们在连续空间中强化学习的效用的第一步。关键词:强化学习;网格细胞;空间语义指针;