Loading...
机构名称:
¥ 1.0

内在人在环强化学习 (HITL-RL) 是一种通过使用可穿戴脑电图 (EEG) 耳机捕捉脑电波来隐式获取人类反馈的方法。它可以显著加速 RL 算法的训练收敛,同时减轻参与训练循环的人类的负担。虽然人类自然会观察 RL 代理的表现,但代理的任何错误行为都可以通过 EEG 信号中的误差电位 1 (ErrP) 识别。然后可以将此信息合并到 RL 算法的奖励函数中以加速其学习。因此,误差电位的检测精度会显著影响 RL 算法的收敛时间。这项工作的重点是使用仅使用现成的 EEG 可穿戴设备检测到的用户脑电波来可靠地检测误差电位。我们首先提出一种新的误差电位解码算法,该算法利用 EEG 信号的空间、时间和频域特性。我们开发了三个类似 Atari 的游戏环境,并招募了 25 名志愿者进行评估。所提出的算法实现了 73.71% 的准确率(比目前最先进的算法提高了 8.11%)。然后我们展示了一种智能丢弃低置信度估计的改进算法能够将准确率提高到 79.51%(提高了 16.63%)。

带有 EEG 可穿戴耳机的人机交互

带有 EEG 可穿戴耳机的人机交互PDF文件第1页

带有 EEG 可穿戴耳机的人机交互PDF文件第2页

带有 EEG 可穿戴耳机的人机交互PDF文件第3页

带有 EEG 可穿戴耳机的人机交互PDF文件第4页

带有 EEG 可穿戴耳机的人机交互PDF文件第5页