控制理论提供了一种自然语言来描述多区域交互和灵活的认知任务,例如隐性注意力或脑机接口 (BMI) 实验,这些实验需要找到足够的局部电路输入,以便以上下文相关的方式控制其动态。在最佳控制中,目标动态应该最大化沿轨迹的长期价值概念,可能受控制成本的影响。由于这个问题通常难以处理,因此当前控制网络的方法大多考虑简化设置(例如,线性二次调节器的变体)。在这里,我们提出了一个数学框架,用于对具有低秩连接的随机脉冲神经元的循环网络进行最佳控制。一个基本要素是控制成本,它惩罚偏离网络默认动态(由其循环连接指定),从而促使控制器尽可能使用默认动态。我们推导出一个贝尔曼方程,该方程指定低维网络状态 (LDS) 的值函数和相应的最佳控制输入。最优控制律采用反馈控制器的形式,如果神经元的脉冲活动倾向于将 LDS 移向更高(更低)值的区域,则该控制器向循环网络中的神经元提供外部兴奋性(抑制性)突触输入。我们使用我们的理论来研究将网络状态引导到特定终端区域的问题,这些终端区域可以位于 LDS 中具有慢速动态的区域内或区域外,类似于标准 BMI 实验。我们的结果为一种具有广泛适用性的新方法奠定了基础,该方法统一了神经计算的自下而上和自上而下的视角。
主要关键词