万亿美元问题

想象一下:您在一家中型 SaaS 公司担任数据分析师的第一天。您已经开始了数据仓库的建设——一些结构化的、可用的数据和大量您还不太确定如何处理的原始数据。但这不是真正的问题。真正的问题是不同的团队正在做他们的[...]

来源:O'Reilly Media _AI & ML

想象一下:您在一家中型 SaaS 公司担任数据分析师的第一天。您已经开始了数据仓库的建设——一些结构化的、可用的数据和大量您还不太确定如何处理的原始数据。但这不是真正的问题。真正的问题是不同的团队在做自己的事情:财务部拥有加载了自定义 DAX 和 Excel 连接的 Power BI 模型。 Sales 使用连接到中央数据湖的 Tableau。营销有一些您尚未想出的定制解决方案。如果您在数据领域工作了很多年,这个场景可能会感觉很熟悉。

然后一位财务总监发电子邮件说:为什么 ARR 在我的仪表板中显示为 2.5 亿美元,而销售人员刚刚在电话会议中报告了 2.75 亿美元?

没问题,你想。你是一名数据分析师;这就是你所做的。你开始挖掘。你发现的并不是简单的计算错误。财务和销售使用不同的日期维度,因此他们测量不同的时间段。他们对“收入”的定义不一致。他们的业务部门层次结构建立在完全不同的逻辑之上:一个隐藏在 Power BI 模型中,另一个硬编码在 Tableau 计算中。您通过层层自定义笔记本、仪表板公式和 Excel 工作簿追踪问题,并意识到创建可管理、稳定和可维护的单一事实版本并不容易。如果不重建公司一半的数据基础设施并实现其他数据用户的合规性,这甚至可能是不可能的,而这本身就是一项全职工作。

VentureBeat 价值 1 万亿美元的人工智能问题

为什么现在这很重要?当我们回到 ARR 问题时,我们会看到,有一种力量正在推动这一紧迫性:人工智能。

研究

那么这实际上是如何工作的呢?让我们回到 ARR 困境。

您可能会想,“我不能在数据仓库或 BI 工具中执行此操作吗?”从技术上来说,是的。但语义层的不同之处在于:模块化和上下文。

这创造了三个直接胜利: