在本文中,我们介绍了一种人工智能介导的框架,该框架可以提供智能反馈来增强人类认知。具体来说,我们利用深度强化学习 (DRL) 提供自适应时间压力反馈,以提高用户在数学算术任务中的表现。时间压力反馈可以通过调节用户的注意力和焦虑来提高或降低用户的表现。根据用户的实时表现由 DRL 策略控制的自适应时间压力反馈可以潜在地解决这一权衡问题。然而,DRL 训练和超参数调整可能需要大量数据和迭代用户研究。因此,我们提出了一个双 DRL 框架,该框架通过与另一个模拟 DRL 代理交互来训练调节 DRL 代理来调节用户表现,该模拟 DRL 代理模仿现有数据集中的用户认知行为。与基线组相比,我们的用户研究证明了双 DRL 框架在增强用户表现方面的可行性和有效性。
主要关键词