机器学习(ML)模型越来越多地用于各种应用程序,从电子商务的推荐系统到医疗保健的诊断预测。在本文中,我们提出了一个新颖的动态框架,用于思考ML模型在表现性的人类ML协作系统中的部署。在我们的框架中,ML建议的引入更改了人类决策的数据生成过程,这只是代理地面真理,然后将其用于培训模型的未来版本。我们表明,这种动态过程原则上可以收敛到不同的稳定点,即ML模型和人+ML系统具有相同的性能。相对于实际地面真理,这些稳定点中的一些是最佳的。我们对1,408名参与者进行了经验用户研究,以展示此过程。在研究中,人类在机器学习预测的帮助下解决了背包问题的实例。这是一个理想的环境,因为我们可以看到ML模型如何学会模仿人类的决策以及该学习过程如何收敛到稳定点。我们发现,对于许多ML性能,人类可以改善ML预测,以动态达到最大背包值的92%的平衡性能。我们还发现,如果人类合理地遵循ML建议,平衡性能可能会更高。最后,我们测试货币激励措施是否可以提高人类决策的质量,但我们找不到任何积极的影响。我们的结果对在人类决策可能偏离无可争议的基础真理的情况下部署ML模型具有实际意义。
朱迪思·巴特勒(Judith Butler)(加利福尼亚大学伯克利分校),米歇尔·卡隆(CSI - écoledes de paris),罗兰·坎努(Roland canu -Pascal Gond(诺丁汉大学),萨拉·格林(曼彻斯特大学),克莱斯·弗雷德里克·赫尔吉森(诺维格·霍尔姆(Norwegian Holm),诺维格·霍尔姆(Norwegian Fishery Science) - 特罗姆索大学(Norwegian Fishery Science) (CERTOP - 图卢兹大学II),蒂姆·米切尔(Tim Mitchell)(纽约大学),菲利普·斯坦纳(CESS - 巴黎大学IV大学),AurélieTricoire(Certop - cert - Toulouse II / Latts - UniversitéMarne-La-vallée大学),Karel Williams(Karel Williams(Karel Williams)曼彻斯特)。