Loading...
机构名称:
¥ 1.0

1引言机器学习领域(ML)近年来经历了一段空前的增长。这种显着的进步可以归因于两个关键因素:计算能力的指数增长和广泛数据集的不断增加[1-3]。然而,这一进展基础的基础是数据收集和标签 - 提出了重大挑战,可以阻碍ML模型的功效和道德实施[4-8]。本评论论文介绍了复杂的数据收集和标签机器学习的世界,并借鉴了数据管理和机器学习社区的见解。机器学习的变革潜力在许多域中显而易见。从疾病诊断和个性化医学[9]革命性医疗保健[10]和在供应链中优化物流[11]中,ML算法正在迅速重塑我们的世界。这些进步的核心在于ML模型从数据,识别模式学习并根据其暴露的信息进行预测的能力。用于训练这些模型的数据的质量和数量对于它们的成功至关重要。高质量,多样化和标记的数据对于构建可在现实世界中有效性能的强大且可推广的ML模型至关重要[12,13]。但是,收集和标记机器学习数据的过程远非直接。此外,关于数据隐私和数据集中潜在偏见的道德考虑训练复杂模型所需的庞大数据可能令人生畏,并且对每个数据点进行精心标记的任务可能非常耗时且昂贵。

机器学习的数据收集和标签技术

机器学习的数据收集和标签技术PDF文件第1页

机器学习的数据收集和标签技术PDF文件第2页

机器学习的数据收集和标签技术PDF文件第3页

机器学习的数据收集和标签技术PDF文件第4页

机器学习的数据收集和标签技术PDF文件第5页

相关文件推荐