详细内容或原文请订阅后点击阅览
众包数据收集——道德 AI 不可或缺的一部分
在我们努力构建强大且无偏见的人工智能解决方案时,我们必须专注于在无偏见、动态和有代表性的数据上训练模型。我们的数据收集过程对于开发可靠的人工智能解决方案极为重要。在这方面,通过众包工人收集 AI 训练数据成为一个关键方面 […]
来源:Shaip 博客在我们努力构建强大且无偏见的 AI 解决方案时,我们有必要专注于在无偏见、动态且具有代表性的数据上训练模型。我们的数据收集过程对于开发可靠的 AI 解决方案极为重要。在这方面,通过众包工人收集 AI 训练数据成为数据收集策略的关键方面。
通过众包工人进行 AI 训练数据在本文中,让我们探讨众包工人的作用、其对开发 AI 学习算法和 ML 模型的影响,以及它对整个过程的需求和好处。
学习算法为什么需要众包工人来构建 AI 模型?
作为人类,我们生成大量数据,但这些生成和收集的数据中只有一小部分有价值。由于缺乏数据基准测试标准,收集到的大多数数据要么有偏见,要么充斥着质量问题,要么不能代表环境。由于越来越多的机器学习和深度学习模型正在开发中,这些模型在海量数据上蓬勃发展,人们越来越需要更好、更新、更多样化的数据集。
机器学习这就是众包工人发挥作用的地方。
众包数据是在大量人群的参与下构建数据集。 众包工人将人类智能注入人工智能。
众包平台将数据收集和注释微任务交给大量多样化的人群。 众包使公司能够获得庞大、动态、经济高效且可扩展的劳动力。
众包平台最受欢迎的众包平台 - Amazon Mechanical Turk,能够在 15 小时内获得 11,000 个人对人对话,并为每条成功的对话向工人支付 0.35 美元。众包工作者的薪酬如此低廉,这凸显了建立道德数据采购标准的重要性。
0.35 美元