摘要:近几十年来,脑机接口 (BCI) 的研究变得更加民主,使用基于脑电图 (EEG) 的 BCI 的实验急剧增加。协议设计的多样性和对生理计算日益增长的兴趣要求同时改进 EEG 信号和生物信号(如皮肤电活动 (EDA)、心率 (HR) 或呼吸)的处理和分类。如果一些基于 EEG 的分析工具已经可用于许多在线 BCI 平台(例如 BCI2000 或 OpenViBE),那么在线使用算法之前,执行离线分析以设计、选择、调整、验证和测试算法仍然至关重要。此外,研究和比较这些算法通常需要编程、信号处理和机器学习方面的专业知识,而许多 BCI 研究人员来自其他背景,对这些技能的培训有限或没有培训。最后,现有的 BCI 工具箱专注于 EEG 和其他脑信号,但通常不包括其他生物信号的处理工具。因此,在本文中,我们描述了 BioPyC,这是一个免费、开源且易于使用的 Python 平台,用于离线 EEG 和生物信号处理和分类。基于直观且引导良好的图形界面,四个主要模块允许用户遵循 BCI 过程的标准步骤,而无需任何编程技能:(1)读取不同的神经生理信号数据格式,(2)过滤和表示 EEG 和生物信号,(3)对它们进行分类,以及(4)可视化并对结果进行统计测试。我们在四项研究中说明了 BioPyC 的使用,即根据 EEG 信号对心理任务、认知工作量、情绪和注意力状态进行分类。
深脑刺激(DBS)通过将电脉冲传递到大脑的基底神经节(BG)区域来治疗由帕金森氏病(PD)引起的运动症状的巨大希望。但是,美国食品药品监督管理局(FDA)批准的DBS设备只能以固定幅度提供连续的DBS(CDB)刺激;这种效率低下的操作可降低设备的电池寿命,无法动态地适应活动,并且可能引起严重的副作用(例如步态障碍)。在这项工作中,我们引入了一个离线增强学习(RL)框架,允许使用过去的临床数据来训练RL政策以实时调整刺激幅度,目的是减少能源利用,同时保持相同的治疗水平(即,控制)功效为CDB。此外,临床原型要求在患者部署之前证明此类RL控制器的安全性和性能。因此,我们还引入了一种离线政策评估(OPE)方法,以在对患者进行部署之前使用历史数据估算RL政策的性能。我们对配备RC+S DBS系统的四名PD患者进行了评估,在每月临床就诊期间采用RL控制器,并通过症状严重程度评估了整体控制功效(即,Bradykinesia和Tremor),PD生物制造商的变化(即,本地现场电位)和患者评分。临床实验的结果表明,我们的基于RL的控制器保持与CDB相同的控制功效水平,但刺激能量显着降低。此外,OPE方法在准确估算和对RL控制器的预期回报方面有效。
摘要 - 在恶劣条件下在复杂情况下驾驶车辆是自动驾驶汽车(AV)的最大挑战。为了解决这个问题,我们在复杂的场景中使用前主动转向系统提出了层次运动计划和稳健的控制策略,并在各种湿滑的道路粘附系数中,同时考虑车辆不确定的参数。通过智能驾驶员模型(IDM)考虑并以车辆跟随模型的形式考虑人类车辆(HVS)的行为(HVS)。然后,在上层中,运动计划者首先使用人工电位场(APF)算法来生成最佳轨迹,例如,路标,边界和静态/动态障碍物,例如道路标记,边界和静态/动态障碍。为了在下层跟踪生成的最佳trajectory,通过应用线性矩阵不等式(LMI)优化方法,使用线性参数变化(LPV)系统来实现离线约束的输出反馈鲁棒模型预测性控制(RMPC),以确保对模型参数的鲁棒性不适合模型不限制。更重要的是,通过增强系统模型,我们提出的方法称为离线RMPC,与三种现有的RMPC方法相比,具有出色的效率,例如,偏置式挡板offline RMPC,在线rmpc,在线rmpc和离线rmpc无需增强模型(离线rmpc w/o am),在不线rmpc w/o am)(均改进了计算时间),并改进了计算时间和添加时间。
有效的混合闭环系统的广泛采用将代表着患有1型糖尿病(T1D)患者的重要里程碑。这些设备通常利用简单的控制算法选择最佳的胰岛素剂量,以将血糖水平保持在健康范围内。在线增强学习(RL)已被用作进一步增强这些设备中葡萄糖控制的方法。以前的方法已显示可降低患者的风险并降低目标范围内所花费的时间,但在学习过程中容易出现不稳定性,通常会导致选择不安全的动作。这项工作提供了对离线RL的评估,用于制定有效的给药政策,而无需在培训期间进行潜在危险的患者互动。本文研究了BCQ,CQL和TD3-BC在管理FDA批准的UVA/Padova葡萄糖动力学模拟器中可用的30名虚拟患者的血糖中的实用性。接受在线RL以实现稳定性能所需的总培训样本的十分之一的培训时,这项工作表明,离线RL可以大大增加健康血糖的时间范围为61。6±0。3%至65。3±0。与最先进的基线相比5%(𝑝<0。001)。这是在低血糖事件中没有任何相关增加的情况下实现的。离线RL也被证明能够纠正常见和具有挑战性的控制场景,例如不正确的推注剂量,不规则的进餐时间和压缩误差。这项工作的代码可在以下网址提供:https://github.com/hemerson1/offline-glucose。
摘要 - 按需(AMOD)系统的自主移动性是一种不断发展的运输方式,其中中央协调的自动驾驶汽车的舰队动态地服务了旅行请求。这些系统的控制通常被称为一个大型网络优化问题,而增强学习(RL)最近已成为解决该领域中开放挑战的一种有前途的方法。最近的集中式RL方法专注于从在线数据中学习,而忽略了实际运输系统中的每样本相互作用。为了解决这些限制,我们建议通过离线强化学习的镜头正式对AMOD系统进行正式控制,并使用仅离线数据学习有效的控制策略,这很容易为当前的移动性运营商提供。我们进一步研究了设计决策,并根据现实世界中移动性系统的数据提供了经验证据,表明了离线学习如何恢复(i)(i)(i)与在线方法表现出相同的AMOD控制策略,(ii)允许样品有效的在线微调和(iii)消除复杂的模拟环境的需求。至关重要的是,本文表明,离线RL是在经济临界系统(例如迁移率系统)中应用基于RL的SO的有希望的范式。
注意:1.我们强烈建议客户在购买我们的产品时仔细检查商标,如果有任何问题,请随时与我们联系。2.电路设计时请不要超过设备的绝对最大额定值。3.Winsemi Microelectronics Co., Ltd 保留对本规格书进行更改的权利,如有更改,恕不另行通知。
摘要 — 顺序建模在离线强化学习 (RL) 中表现出色,其中决策转换器 (DT) 是最显著的代表之一,取得了显著的成功。然而,RL 轨迹具有与传统序列(例如文本或音频)不同的独特属性:(1)局部相关性,其中 RL 中的下一个状态在理论上仅由基于马尔可夫决策过程 (MDP) 的当前状态和动作决定,以及 (2) 全局相关性,其中由于轨迹的时间连续性,每个步骤的特征都与长期历史信息相关。在本文中,我们提出了一种新颖的动作序列预测器,名为 Mamba Decision Maker (MambaDM),其中 Mamba 有望成为序列建模范式的有前途的替代方案,因为它可以有效地建模多尺度依赖关系。特别是,我们介绍了一种新颖的混合器模块,它可以熟练地提取和集成输入序列的全局和局部特征,从而有效地捕捉 RL 数据集中的相互关系。大量实验表明,MambaDM 在 Atari 和 OpenAI Gym 数据集上实现了最佳性能。此外,我们通过实证研究了 MambaDM 的扩展规律,发现增加模型大小不会带来性能提升,但将 MambaDM 的数据集大小扩大 2 倍可以在 Atari 数据集上获得高达 33.7% 的得分提升。本文深入探讨了 MambaDM 在 RL 领域的序列建模能力,为未来在稳健高效的决策系统方面的进步铺平了道路。
广泛采用有效的混合闭合环系统将为患有1型糖尿病(T1D)的人提供重要的护理里程碑。这些设备通常利用简单的控制算法选择最佳的胰岛素剂量,以将血糖水平保持在健康范围内。在线增强学习(RL)已被用作进一步增强这些设备中葡萄糖控制的方法。与经典的对照算法相比,先前的方法已被证明可以降低患者的风险和降低焦油范围的时间,但在学习过程中容易出现不稳定性,通常会导致选择不安全的动作。这项工作介绍了对o ffl iNe rl的评估,用于制定施用剂量政策,而无需在训练过程中进行潜在危险的患者互动。本文研究了BCQ,CQL和TD3-BC在管理FDA批准的UVA/Padova葡萄糖动力学模拟器中可用的30名虚拟患者的血糖中的实用性。接受在线RL以实现稳定性能所需的总培训样本的十分之一的培训时,这项工作表明,在健康的血糖范围内,OfflIne rl可以显着增加61个。6±0。3%至65。3±0。与最先进的基线相比5%(p <0。 001)。 这是在低血糖事件中没有任何相关增加的情况下实现的。 o rl也证明能够纠正与最先进的基线相比5%(p <0。001)。这是在低血糖事件中没有任何相关增加的情况下实现的。o rl也证明能够纠正
在离线增强学习(RL)中,通过离散时间钟形方程更新值函数通常会由于可用数据范围有限而遇到挑战。这种限制源于Bellman方程,该方程无法准确预测未访问的状态的价值。为了解决这个问题,我们引入了一种创新的解决方案,该解决方案桥接了连续和离散的RL方法,利用了它们的优势。我们的方法使用离散的RL算法从数据集中得出值函数,同时确保该函数的第一个衍生衍生物与汉密尔顿 - 雅各布·贝尔曼在连续RL中定义的状态和动作的局部特征与状态和动作的局部特征一致。我们为确定性策略梯度方法和随机性政策梯度方法提供了实用算法。在D4RL数据集上进行的实验显示,合并一阶信息可显着改善离线RL问题的政策性能。
由于数据中心的能源消耗和二氧化碳排放量不断增加,ANR DATAZERO2 项目旨在设计完全依靠本地可再生能源和存储设备运行的自主数据中心,以克服间歇性问题。为了优化可再生能源和存储设备的使用,MILP 求解器通常负责分配要提供给数据中心的电力。但是,为了减少计算时间并使方法可扩展,使用多项式时间算法会更合适。本文旨在展示和证明,通过使用二分搜索方法的确定性算法可以提供最佳功率分布。考虑到初始问题的主要约束,大量实验结果显示出与 MILP 给出的结果相似的结果。这些有希望的结果鼓励我们继续朝这个方向努力,提出一种考虑不确定性的数据中心电源高效管理方法。