人类决策受到系统性错误的困扰,这些错误可能会带来灾难性的后果。先前的研究发现,通过教授人们决策策略,使他们能够在特定情况下做出更好的选择,可以部分预防此类错误。这种方法的三个瓶颈是我们对有效决策策略的了解有限、在训练任务之外的学习迁移有限,以及向大量人有效教授良好决策策略的挑战。我们介绍了一种解决这些问题的通用方法,该方法利用人工智能来发现和教授最佳决策策略。作为概念验证,我们开发了一个智能导师,它可以在即时奖励无法预测长期结果的环境中向人们教授自动发现的最佳启发式方法。我们发现,与我们的智能导师一起练习比传统的改善人类决策的方法更有效。使用我们的认知导师进行训练的好处转移到更具挑战性的任务上,并随着时间的推移而保留下来。我们通过开发智能导师来改善人类决策的一般方法也在另一个具有非常不同奖励结构的环境中被证明是成功的。这些发现表明,利用人工智能来发现和教授最佳认知策略是一种改善人类判断和决策的有前途的方法。
主要关键词