我们对部署机器学习算法的数字平台上的算法集体行动进行了原则性研究。我们提出了与公司学习算法相互作用的集体互动的简单理论模型。集体池通过指示参与者如何修改自己的数据以实现集体目标,从而执行参与个人的数据并执行算法策略。我们在三个基本学习理论环境中研究了该模型的后果:非参数最佳学习,参数风险最小化和基于梯度的优化。在每种情况下,我们提出了协调的算法策略,并将自然成功标准描述为集体规模的函数。与我们的理论相辅相成,我们对一项技能分类任务进行了系统的实验,该任务涉及自由职业者的演出平台中成千上万的简历。通过超过两千种类似伯特语言模型的模型培训运行,我们看到了我们的经验观察和我们理论的预测之间出现了惊人的对应关系。综上所述,我们的理论和实验广泛支持这样的结论:分数大小的算法集体可以对平台的学习算法产生重大控制。
主要关键词