详细内容或原文请订阅后点击阅览
分析工程师的数据建模:完整入门
最好的数据模型使得提出坏问题变得困难,而回答好问题则变得容易。分析工程师的数据建模:完整入门教程首先出现在《走向数据科学》上。
来源:走向数据科学与技术规格无关。这是关于像企业一样思考。将其视为整个分析室的蓝图。如果蓝图混乱,你的房子就会崩溃。如果它是结构化和有组织的,您的团队就能快速找到见解。
您正盯着一张充满客户订单、产品价格和销售日期的电子表格。很乱。你的“仪表板”很慢。您尝试回答一个简单的问题,例如:上个季度披萨的收入是多少?但最终得到的数字不符。为什么?因为你的数据模型简直是一团糟。
在这篇博文中,我将引导您了解每个分析工程师都应该了解的核心数据建模概念。暂时忘掉 Power BI 和 Microsoft Fabric。这是关于核心原则——模型背后的原因。无论使用什么工具,这些想法都有效。
让我们首先介绍一下挑战。想象一下您经营一家小比萨饼店。您的“数据库”是一个 Excel 工作表:订单 ID、客户姓名、地址、披萨类型、数量、价格。看起来很简单,对吧?问题?约翰·史密斯的地址在每一份订单中都会重复。如果他搬家,您就必须编辑 37,000 行订单才能更新他的地址。看起来不太聪明,对吧?
您的数据模型就是解决方案。字面意思是:顾客住在自己的桌子上。订单链接到客户,无需复制地址。这与您如何可视化数据无关。关键是要对其进行组织,以便在您提出问题时数据有意义。
但是,数据建模早在数据存储在电子表格或实际数据库之前就开始了。在以下部分中,我们将介绍核心数据建模概念 - 无论您计划采用哪种建模方法或用于物理实现的工具,都应该在每个数据建模场景中实现这些概念。
