运动皮层 (MC) 如何在动态环境中从复杂的肌肉骨骼系统产生有目的且可推广的运动?为了阐明潜在的神经动力学,我们使用目标驱动的方法来对 MC 进行建模,将其目标视为控制器,通过期望状态驱动肌肉骨骼系统以实现运动。具体来说,我们将 MC 制定为循环神经网络 (RNN) 控制器,该控制器产生肌肉命令,同时接收来自生物学上准确的肌肉骨骼模型的感觉反馈。鉴于在高级物理模拟引擎中实现的这种实时模拟反馈,我们使用深度强化学习来训练 RNN,以在指定的神经和肌肉骨骼约束下实现所需的运动。训练模型的活动可以准确解码实验记录的神经群体动态和单个单元 MC 活动,同时很好地推广到与训练明显不同的测试条件。同时进行目标和数据驱动的建模,其中我们使用记录的神经活动作为 MC 的观察状态,进一步增强了直接和可推广的单个单元解码。最后,我们表明该框架阐明了神经动力学如何实现灵活控制运动的计算原理,并使该框架易于用于未来的实验。
我们提出了一个控制理论框架来研究嵌入在模拟环境中的生物驱动人工神经系统(Sussillo,2014)的稳定性和可控性。从高层的角度来看,这个框架模拟了脑-机-环境的相互作用。我们首先考虑建模一个神经系统在虚拟环境中执行行为任务的问题。用控制理论的语言来说,神经系统与环境过程形成一个闭环反馈控制器。在第二步中,我们模拟神经系统的退化(例如在传感器或执行器处)并添加一个二级控制器(假肢),目的是恢复行为功能。在此过程中,我们考虑了大脑模型中的不确定性、非线性、测量噪声以及可观察状态和可控神经元的有限可用性。神经系统,从单个神经元到大规模群体,都以复杂的动态为特征,建模和控制可能具有挑战性(Ritt and Ching,2015)。经典控制理论(Khalil,2002;Brunton 和 Kutz,2017;Astrom 和 Murray,2020)为设计控制律提供了强大的工具,并在神经技术领域得到广泛应用,例如机械臂或计算机光标的闭环脑机接口 (BMI) 控制(Shanechi 等人,2016)、癫痫发作缓解的模型预测控制(Chatterjee 等人,2020)以及大脑在认知状态之间转换的机制解释(Gu 等人,2015)。闭环控制的一个特别成功的应用是通过深部脑刺激治疗帕金森病。在那里,可以使用基于阈值、比例积分或自调节控制器将病理性 β 波段振荡活动抑制在所需的目标水平(Fleming 等人,2020a、b)。 Schiffi (2011) 建立了一种将控制理论与神经科学和生物医学联系起来的典型方法,其中时空皮质动态模型与卡尔曼滤波器相结合,以估计未观察的状态并跟踪未知或漂移的模型参数。神经形态社区中的团队最近通过实现生物学上合理的操作和学习状态估计和控制规则(Friedrich 等人,2021;Linares-Barranco 等人,2022)以及神经形态 BMI 电路(Donati 和 Indiveri,2023)为这项工作做出了贡献,这有望在低功耗运行时实现更好的生物相容性。在上述许多方法中反复出现的一些挑战是线性(可实现)或低维系统的假设、对底层动态的知识或所需目标状态的可用性(如帕金森病的 DBS)。本文针对这些局限性做出了两项主要贡献。首先,我们建议一致使用动力系统来模拟大脑、环境、和假肢。除了统一方法论之外,这种选择还可以灵活地对不同程度的真实模型进行实验。在这里,我们展示了循环神经网络 (RNN) 作为神经系统和假肢的简单、高度可扩展的构建块的使用。其次,我们逐步消除了线性、系统知识、完全可观测性和监督目标状态的假设,通过使用强化学习 (RL)(Sutton 和 Barto,2020 年)进行系统识别和合成假肢控制器。