BI 已死,BI 万岁

真正的瓶颈从来不是分析。BI 已死,BI 万岁的帖子首先出现在《走向数据科学》上。

来源:走向数据科学

在数据中,我看到相同的模式一次又一次地重复:

  • 一家(大型)科技公司遇到了技术或流程限制。
  • 他们使用新的软件/范式(根据自己的规模、约束和工程文化设计)在内部解决这个问题。
  • 他们写了这件事。 (也许,如果星星对齐,开源它)。
  • 几个工程师创办了一家公司来销售托管版本。
  • 几年后,无论好坏,业界的其他公司都采用了它。
  • 例子有很多:Airbnb 在 2015 年写了一篇关于 Airflow 的文章;现代数据堆栈诞生于一系列有关 Uber、Netflix 等内部数据平台的帖子; dbt 从一种内部工具变成了当今数据团队如何建模数据的事实上的标准。有时该工具运行得很干净,有时它只能在其构建的环境中工作,但模式仍然存在。

    每个周期都是通过解决基本约束或广泛使用资源而实现的。分布式计算开启了 Hadoop 时代,而廉价的云存储和自助服务工具的​​兴起开启了现代数据堆栈 (MDS)。

    然而,在 MDS 时代,瓶颈不是技术——而是人类的分析能力:要问什么问题,在哪里(以及如何)寻找答案,以及这些答案如何与期望的业务成果联系起来。没有任何额外的数据或计算可以解决这个问题,正如我们通过交付成千上万个没有任何具体业务成果的 dbt 模型所集体证明的那样。有一段时间,这似乎是我们不得不忍受的一个无法解决的限制。

    然后人工智能代理到达并翻转了脚本。第一次,提出问题、探索数据和得出答案的能力不再与您可以雇用多少分析师或您可以构建多少仪表板挂钩。数据人员的分析不再是瓶颈。

    表示新的周期已经开始。

    BI 究竟出了什么问题?

    BI 的典型工作流程一直是这样的: