数据湖 (DL) 已成为管理数据科学项目的组织的热门资源。随着围绕数据驱动决策机制的道德争论愈演愈烈,负责任的人工智能的概念变得更加明显。负责任的人工智能框架严重依赖于高质量数据,这使得对所用数据质量的评估以及数据质量的新视角和维度成为焦点。此外,只有考虑评估数据的背景才能评估数据质量。本文介绍了我们的情境感知数据质量管理方法,该方法为 DL 中的数据质量问题提供了全面的解决方案。我们的方法旨在适应不同的环境,确保在整个数据生命周期内进行数据质量管理。我们通过在 DL 架构中定义上下文和数据质量管理处理的不同组件来实现这一目标,这对现有工作做出了新颖的贡献。
主要关键词