大多数数据质量计划在开始之前就失败了。原因如下。

给我看看你的数据质量记分卡,我会告诉你一年后你是否会成功。照片由 Braden Collum 在 Unsplash 拍摄我每天都会与那些准备投入大量时间和资源用于注定会失败的数据质量计划的组织交谈。激励措施和 KPI 可以推动良好行为,这并不奇怪。销售薪酬计划受到严格审查,因此它们经常成为董事会会议的话题。如果我们对数据质量记分卡给予同样的关注会怎样?即使在其鼎盛时期,来自 Hadoop 时代的传统数据质量记分卡也很少取得巨大成功。我之所以知道这一点,是因为在创办 Monte Carlo 之前,我曾担任运营副总裁多年,试图创建能够推动信任和采用的数据质量标准。在过去几年中,云计算和元数据管理方面的进步使得组织大量数据成为可能。数据工程流程开始趋向于更长期的工程学科的成熟度和严谨性水平。当然,人工智能有潜力简化一切。虽然这个问题还没有——也可能永远不会——完全解决,但我已经看到一些组织采用了最佳实践,而这些最佳实践是计划成功与 12 个月后再召开一次启动会议之间的区别。以下是构建数据质量记分卡的 4 个关键经验教训:了解哪些数据很重要衡量机器正确使用胡萝卜加大棒自动评估和发现了解哪些数据很重要

来源:走向数据科学

大多数数据质量计划在开始之前就失败了。原因如下。

大多数数据质量计划在开始之前就失败了。原因如下。

给我看看你的数据质量记分卡,我会告诉你一年后你是否会成功。

照片由 Braden Collum 在 Unsplash 上拍摄
照片由 Braden Collum 在 Unsplash 上拍摄
Braden Collum Unsplash

我每天都会与那些准备投入大量时间和资源用于注定失败的数据质量计划的组织交谈。

激励措施和 KPI 会推动良好行为,这并不是什么新鲜事。销售薪酬计划受到严格审查,以至于它们经常成为董事会会议的话题。如果我们对数据质量记分卡给予同样的关注会怎样?

即使在 Hadoop 时代的传统数据质量记分卡鼎盛时期,也很少取得巨大成功。我之所以知道这一点,是因为在创办 Monte Carlo 之前,我曾担任运营副总裁多年,试图创建能够推动信任和采用的数据质量标准。

在过去几年中,云和元数据管理方面的进步使得组织大量数据成为可能。

数据工程流程开始趋向于更长期存在的工程学科的成熟度和严谨性水平。当然,人工智能有潜力简化一切。

虽然这个问题还没有完全解决——而且可能永远不会完全解决,但我已经看到组织采用最佳实践,这是计划成功与 12 个月后再举行一次启动会议之间的区别。

以下是构建数据质量记分卡的 4 个关键经验教训:

了解哪些数据重要

任何数据相关计划失败的最可靠方法是假设所有数据都具有同等价值。确定重要性的最佳唯一方法是与企业交谈。

Red Ventures 的 Brandon Beidel 阐明了一个很好的起点:

阐明了一个很好的起点

“我想问:

  • 您如何使用此表?
  • 它有什么用途?
  • 如果此数据延迟,谁需要收到通知?”
  • 测量机器

    Unsplash 用法