数据中最佳的风险缓解策略?单一事实来源

每个数据领导者都有这个故事的一个版本。监管审计发现了一个跨系统不匹配的指标。一位董事会成员在连续提交的两份报告中发现了相互矛盾的收入数字。人工智能工具根据自创建该工具的分析师离开公司两次以来一直不受监管的数据生成建议[...]

来源:O'Reilly Media _AI & ML

每个数据领导者都有这个故事的一个版本。监管审计发现了一个跨系统不匹配的指标。一位董事会成员在连续提交的两份报告中发现了相互矛盾的收入数字。人工智能工具根据自两年前创建该工具的分析师离开公司以来一直没有受到监管的数据生成建议。具体细节发生了变化,但模式没有变化:在堆栈的某个地方,数据风险变成了业务风险,但没有人预见到它的到来。

在我的第一篇文章中,我介绍了语义层是什么以及它为何重要。在第二篇文章中,我与早期采用者讨论了实际构建时会发生什么。本文探讨了不同的角度:语义层作为风险缓解策略。这不是抽象的、合规框架意义上的风险,而是每天悄然耗尽组织精力的实际运营风险——决策者收到错误数据、错误人员收到敏感数据以及从未完全传播的指标变化。

三大风险隐藏在众目睽睽之下

数据风险往往集中在三个方面,大多数组织同时面临所有这些方面的风险。

首先是准确性。不准确的数据导致错误的决策是分析中最古老的问题,而且它并没有消失。情况变得更糟了。随着组织添加更多工具、更多仪表板和更多人工智能驱动的应用程序,出错的范围也在扩大。收入指标在 Tableau 工作簿中以一种方式定义,在 Power BI 模型中以另一种方式定义,在 Python 笔记本中以第三种方式定义,这不仅带来不便。这是一种责任。当领导层根据一个被证明是错误的数字(或者更常见的是,根据一个正确版本的数字)做出战略决策时,下游后果是真实的:资源分配不当、错过目标、对数据团队的信任受到侵蚀。

传统方法:更多人员、更多工具、更多问题

语义方法:一次治理,随处访问

降低风险,而不是消除风险